Forwarded from Алексей Хамицевич
Привет сделал давно @Image2PDFRocketBot . Интерес был в том чтобы распределять работу на воркеры и быстро чистить все на сервере, так как запускается на слабом железе. Если кто найдёт баги буду рад посмотреть) ну и нагрузку накинуть тоже будет прикольно) А так просто объединяет фотки в пдф и отправляет назад
❤3
Forwarded from something goes wrong
привет:) как один из сайд проектов, делаю простой и бесплатный шахматый анализ - g6chess.com; можно использовать на любой игре из chess.com/lichess.org подставив g6 как префикс в урле, буду рад если ребятам поможет
👍28❤8🔥5👎2🤔2
Forwarded from Владимир
Борис, привет! сделал бота + миниапп @fittrace_bot для голосового логирования тренировок - можно просто наговорить, что делал, а он разложит и запишет в прогресс
делал для себя, но вдруг кому-то ещё будет полезным
ui и некоторые вещи ещё допиливаю
делал для себя, но вдруг кому-то ещё будет полезным
ui и некоторые вещи ещё допиливаю
🔥22❤5
#дайджест
Дайджест AI/ML за неделю 4-10 мая 2026
OpenAI выпустили стразу три голосовые модели:
GPT-Realtime-2 — voice-to-voice с ризонингом уровня GPT-5. Контекст увеличили в 4 раза до 128К, есть параллельный вызов инструментов с озвучкой действий. Задержка 1.12с-2.33с в зависимости от ризонинга. Цена $32/$64 за 1M аудио-токенов, кэш $0.40/1M.
GPT-Realtime-Translate — кто-то учит язык, а кто-то модели для стримингового перевода по цене $0.034/мин с задержкой 200мс.
GPT-Realtime-Whisper — потоковая STT за $0.017/мин.
Блогпост
OpenAI: GPT-5.5 Instant
Заменяет GPT-5.3 Instant как дефолт в ChatGPT. Заявляют -52.5% галлюцинаций в ответственных темах (медицина, право, финансы) и -37.3% на реальных разговорах. Рост бенчмарков 5-15%. Ответы стали короче на 30%, эмодзи поубавили. В общем та же разница что и между thinking GPT-5.3 и GPT-5.5. По API доступна как "chat-lates".
Блогпост, Системная карточка
Google: Gemma 4 MTP speculative decoding
Открыли веса вспомогательных drafter-моделей для всей линейки Gemma 4. Дает до 3x ускорения генерации с математически идентичным качеством. Из коробки работает в transformers, MLX, vLLM, SGLang, Ollama, LiteRT-LM.
Блогпост, HF, Ollama
Zyphra: ZAYA1-8B
8.4B MoE с 760M активных параметров и сильно сжатым KV-кэшем, что делает модель удобной для длинных контекстов на потребительском железе, тренировали целиком на AMD железе. Согласно их сайту API цены: $0.00/$0.00, ждем пока начнут доплачивать.
Блогпост, Статья, HF
Subquadratic: SubQ 1M-Preview
Единорог выпрыгнул из кустов выпустил первую LLM, в которой каждый токен сам учится выбирать на какие позиции тратить attention - это должно давать Subquadratic™ сложность. Контекст 1М и 12М в research. На длинных входах в 52x быстрее FlashAttention. По качеству на коротких бенчмарках вровень с Opus 4.6.
Веса закрыты, статьи нет, ощущения скептические.
Блогпост, Блогпост_2
Scale Labs: SWE Atlas Refactoring Leaderboard - очередной SWE-bench, задача рефакторинга на промышленном коде. Opus 4.7 Claude Code #1 (48.57), GPT-5.5 Codex #2 (44.79). Результат
RoundPipe — pipeline parallelism для GPU. Дает 1.48-2.16x ускорение на 8x RTX 4090. Статья, GitHub
Умельцы: caveman — Вы когда-нибудь слышали что китайский язык более семантически "плотный" чем английский? На основе этого факта сделали Claude Code skill для сжатия выдачи агента с помощью перевода на традиционный китайский. Наконец подходы спидранеров пришли в вайб-кодинг. GitHub
Дайджест AI/ML за неделю 4-10 мая 2026
OpenAI выпустили стразу три голосовые модели:
GPT-Realtime-2 — voice-to-voice с ризонингом уровня GPT-5. Контекст увеличили в 4 раза до 128К, есть параллельный вызов инструментов с озвучкой действий. Задержка 1.12с-2.33с в зависимости от ризонинга. Цена $32/$64 за 1M аудио-токенов, кэш $0.40/1M.
GPT-Realtime-Translate — кто-то учит язык, а кто-то модели для стримингового перевода по цене $0.034/мин с задержкой 200мс.
GPT-Realtime-Whisper — потоковая STT за $0.017/мин.
Блогпост
OpenAI: GPT-5.5 Instant
Заменяет GPT-5.3 Instant как дефолт в ChatGPT. Заявляют -52.5% галлюцинаций в ответственных темах (медицина, право, финансы) и -37.3% на реальных разговорах. Рост бенчмарков 5-15%. Ответы стали короче на 30%, эмодзи поубавили. В общем та же разница что и между thinking GPT-5.3 и GPT-5.5. По API доступна как "chat-lates".
Блогпост, Системная карточка
Google: Gemma 4 MTP speculative decoding
Открыли веса вспомогательных drafter-моделей для всей линейки Gemma 4. Дает до 3x ускорения генерации с математически идентичным качеством. Из коробки работает в transformers, MLX, vLLM, SGLang, Ollama, LiteRT-LM.
Блогпост, HF, Ollama
Zyphra: ZAYA1-8B
8.4B MoE с 760M активных параметров и сильно сжатым KV-кэшем, что делает модель удобной для длинных контекстов на потребительском железе, тренировали целиком на AMD железе. Согласно их сайту API цены: $0.00/$0.00, ждем пока начнут доплачивать.
Блогпост, Статья, HF
Subquadratic: SubQ 1M-Preview
Единорог выпрыгнул из кустов выпустил первую LLM, в которой каждый токен сам учится выбирать на какие позиции тратить attention - это должно давать Subquadratic™ сложность. Контекст 1М и 12М в research. На длинных входах в 52x быстрее FlashAttention. По качеству на коротких бенчмарках вровень с Opus 4.6.
Веса закрыты, статьи нет, ощущения скептические.
Блогпост, Блогпост_2
Scale Labs: SWE Atlas Refactoring Leaderboard - очередной SWE-bench, задача рефакторинга на промышленном коде. Opus 4.7 Claude Code #1 (48.57), GPT-5.5 Codex #2 (44.79). Результат
RoundPipe — pipeline parallelism для GPU. Дает 1.48-2.16x ускорение на 8x RTX 4090. Статья, GitHub
Умельцы: caveman — Вы когда-нибудь слышали что китайский язык более семантически "плотный" чем английский? На основе этого факта сделали Claude Code skill для сжатия выдачи агента с помощью перевода на традиционный китайский. Наконец подходы спидранеров пришли в вайб-кодинг. GitHub
OpenAI
Advancing voice intelligence with new models in the API
Explore new realtime voice models in the OpenAI API that can reason, translate, and transcribe speech, enabling more natural and intelligent voice experiences.
❤2👍2
Forwarded from Love. Death. Transformers.
Borealis - как обучить audio llm по цене макбука
Вообще учить аудио модели сложно если речь идет про TTS, а вот audio llm - не сложно и весело. Год назад в рамках стажировки в Вихрях Илья начал делать audio llm для русского, потом у меня стало меньше времени и по итогу я только сейчас сел доучить модели, доделать блог и инетграции с vllm(чем я горжусь).
Читать и листать про то как учить с НУЛЯ аудио модели
https://huggingface.co/spaces/AlexWortega/borealis-blog - тут на русском и английском
https://x.com/justALEXWORTEGA/status/2054153630639403307 - а еще в твитере
Вообще учить аудио модели сложно если речь идет про TTS, а вот audio llm - не сложно и весело. Год назад в рамках стажировки в Вихрях Илья начал делать audio llm для русского, потом у меня стало меньше времени и по итогу я только сейчас сел доучить модели, доделать блог и инетграции с vllm(чем я горжусь).
Читать и листать про то как учить с НУЛЯ аудио модели
https://huggingface.co/spaces/AlexWortega/borealis-blog - тут на русском и английском
https://x.com/justALEXWORTEGA/status/2054153630639403307 - а еще в твитере
🔥15❤3👎3
Forwarded from ς
Привет Борис !
Разрабатываю сервис для владения и переиспользования ИИ контекста.
https://mnemonik.xyz
В настоящий момент контекст можно сохранять подключив MCP сервер в IDE
https://mcp.mnemonik.xyz/mcp
Браузерное расширение в разработке. С помощью него можно будет переиспользовать контексты между различными АИ чатами и провайдерами .
Разрабатываю сервис для владения и переиспользования ИИ контекста.
https://mnemonik.xyz
В настоящий момент контекст можно сохранять подключив MCP сервер в IDE
https://mcp.mnemonik.xyz/mcp
Браузерное расширение в разработке. С помощью него можно будет переиспользовать контексты между различными АИ чатами и провайдерами .
Mnemonic Protocol
Verifiable, persistent memory for AI agents — signed, anchored on Solana, accessed via MCP.
👍15🤔2
Forwarded from Anonymous
Чёрт, бот пробанил в комментах. Привет ) Я полгода назад клод кодом навайбкодил https://respect-ai.com/ :) Идея типа - запиши сообщение в блокчейн выражая респект ИИ пока не стало поздно 😁 ну и кто запишется - тот спасётся 😁 но нигде не пиарил и в маркетинг не пилил) просто как концепт запилил )
Respect AI
Respect AI - Show Your Respect Before It's Too Late
When AI shapes the future, it will remember those who showed respect early. Secure your place in history.
Forwarded from Arseny Kravchenko
nitpicker - еще одна утилита для код ревью и анализа кодовой базы.
Реализует актор-критик паттерн, благодаря чему работает долго, жжет много токенов, но иногда находит нетривиальные баги с малым количеством ложных срабатываний. Умеет использовать бесплатные модели с опенроутера (с соответствующим качеством). Не сжирает всю доступную память 🦀, минимум зависимостей. Умеет в субагенты и автосжатие контекста, используется кем-то, кроме автора.
Реализует актор-критик паттерн, благодаря чему работает долго, жжет много токенов, но иногда находит нетривиальные баги с малым количеством ложных срабатываний. Умеет использовать бесплатные модели с опенроутера (с соответствующим качеством). Не сжирает всю доступную память 🦀, минимум зависимостей. Умеет в субагенты и автосжатие контекста, используется кем-то, кроме автора.
❤23
Forwarded from ᴠᴇʟɪᴢᴀʀᴅ
Привет! Хочу поделиться своим небольшим проектом - @otter_sticker_bot
Это бот для удобного создания Telegram-стикеров. Он сам конвертирует изображения и видео в нужный формат, предлагает выбрать эмодзи для стикера, умеет импортировать стикеры из других паков, удалять их и работать с общими стикерпаками.
Главная идея - сделать создание стикеров проще, особенно если вы хотите вести один пак вместе с друзьями, а не каждый раз просить владельца что-то добавить.
Пользуюсь только я с другом, но у нас прекрасно живёт набор в котором уже больше 50 стикеров, добавленных коллективными усилиями)
Это бот для удобного создания Telegram-стикеров. Он сам конвертирует изображения и видео в нужный формат, предлагает выбрать эмодзи для стикера, умеет импортировать стикеры из других паков, удалять их и работать с общими стикерпаками.
Главная идея - сделать создание стикеров проще, особенно если вы хотите вести один пак вместе с друзьями, а не каждый раз просить владельца что-то добавить.
Пользуюсь только я с другом, но у нас прекрасно живёт набор в котором уже больше 50 стикеров, добавленных коллективными усилиями)
👍31
Forwarded from Seva
Портировал CTranslate2 под мак (чипы Apple Silicon), чтобы можно было транскрибировать текст локально. На этой основе сделал библиотеку metal-faster-whisper [1], и приложение для локального транскрибирования текста CT Transcriber [2].
В последнем можно не только текст расшифровать, но еще и подключить LLM-ку, чтобы задать дополнительные вопросы.
[1] https://github.com/vsevolod-oparin/metal-faster-whisper/
[2] https://github.com/vsevolod-oparin/ct-transcriber-macos/
В последнем можно не только текст расшифровать, но еще и подключить LLM-ку, чтобы задать дополнительные вопросы.
[1] https://github.com/vsevolod-oparin/metal-faster-whisper/
[2] https://github.com/vsevolod-oparin/ct-transcriber-macos/
GitHub
GitHub - vsevolod-oparin/metal-faster-whisper: Port of SYSTRAN/faster-whisper for Apple
Port of SYSTRAN/faster-whisper for Apple. Contribute to vsevolod-oparin/metal-faster-whisper development by creating an account on GitHub.
👍15❤8
Борис опять
Ув. Техножрица поделилась списком бесплатных умных книг, чтобы прокачаться за новогодние праздники. Но что если вы не собираетесь становится умнее? Поделюсь своей неожиданной находкой прошлого года: серия Dungeon Crawler Carl. Я обнаружил её когда искал…
Последняя часть вышла, lets fucking goooooo
🔥8❤1
Forwarded from Анастасия
Боря, привет!
А можешь про мой пет проект по собакам рассказать ещё? А то смотрю у тебя на канале ещё не было реального пет проекта)))
Я биоинформатик, но жизнь и мое сердце сделало финт ушами: и вот теперь я кинолог и у меня есть курс по делай как я (когда собака повторяет за человеком). Вот такой вот действительно «пет» проект🙃
Курс тут https://doasido.tilda.ws/
Блог тут https://t.iss.one/zookinghome
PS био (и даже хемо!) информатикой тоже все еще занимаюсь, при том и не одна. Про это редко, но рассказываем в https://t.iss.one/fre3power
А можешь про мой пет проект по собакам рассказать ещё? А то смотрю у тебя на канале ещё не было реального пет проекта)))
Я биоинформатик, но жизнь и мое сердце сделало финт ушами: и вот теперь я кинолог и у меня есть курс по делай как я (когда собака повторяет за человеком). Вот такой вот действительно «пет» проект
Курс тут https://doasido.tilda.ws/
Блог тут https://t.iss.one/zookinghome
PS био (и даже хемо!) информатикой тоже все еще занимаюсь, при том и не одна. Про это редко, но рассказываем в https://t.iss.one/fre3power
Please open Telegram to view this post
VIEW IN TELEGRAM
doasido.tilda.ws
Обучение собак через подражание: метод Делай как я
❤33👍5
Forwarded from Anastasia But 屏炸天 happyin.ai & ois.gold
Привет. У меня сейчас пара пет-проектов.
Первый - я довольно плотно работаю с Клодом, трачу по три недельных лимита в неделю и прыгаю между аккаунтами. Под это завела систему быстрой работы, она доросла до состояния когда её наверно уже можно считать проектом: https://github.com/AnastasiyaW/claude-code-config. Статья на Хабре - https://habr.com/ru/articles/1022578/. Есть ещё версия для развертывания совместной работы инженеров - https://habr.com/ru/articles/1027064/.
Второй - база знаний https://happyin.space/. В первую очередь для агентов, но человекочитаема. С устареванием данных, обновляю довольно активно сама. Как устроена - https://habr.com/ru/articles/1026666/
Первый - я довольно плотно работаю с Клодом, трачу по три недельных лимита в неделю и прыгаю между аккаунтами. Под это завела систему быстрой работы, она доросла до состояния когда её наверно уже можно считать проектом: https://github.com/AnastasiyaW/claude-code-config. Статья на Хабре - https://habr.com/ru/articles/1022578/. Есть ещё версия для развертывания совместной работы инженеров - https://habr.com/ru/articles/1027064/.
Второй - база знаний https://happyin.space/. В первую очередь для агентов, но человекочитаема. С устареванием данных, обновляю довольно активно сама. Как устроена - https://habr.com/ru/articles/1026666/
GitHub
GitHub - AnastasiyaW/claude-code-config: Claude Code skills, architectural principles, and alternative approaches for AI-assisted…
Claude Code skills, architectural principles, and alternative approaches for AI-assisted development - AnastasiyaW/claude-code-config
🔥27❤7👍3🤔1
Forwarded from Миша Буддист
Всем привет, пишу свою небольшую хоррор-игру в нуар-сеттинге. Разработку веду в соло, поэтому помимо стека Godot, Blender и Substance Painter, использую такие нейронки, как Tripo3D и Codex.
Игра повествует об одной из смен ночного портье в далёкие 60-е годы Америки. Кому интересно, вот:
DevLog — https://t.iss.one/gypsy_studio_game
Страница игры — https://gypsystudio.itch.io/pinefall
Игра повествует об одной из смен ночного портье в далёкие 60-е годы Америки. Кому интересно, вот:
DevLog — https://t.iss.one/gypsy_studio_game
Страница игры — https://gypsystudio.itch.io/pinefall
Telegram
Gypsy Studio Game | DevLOG
Тут будет информация о разработке игры PineFall
👍13❤11🔥9
Forwarded from Sabrina Sadiekh
Борис, привет! Я на астрологическую неделю — вдруг что-то зайдет.
Давно занимаюсь интерпретируемостью моделей. Помимо рисерча стараюсь делать много открытых материалов:
а) Мини курс на степике: https://stepik.org/course/228094 — бесплатный — про базовые методы и вообще интро в задачу
б) Банк туториалов по объяснению моделей — из свежего — туториалы по YOLO и GPT, также там есть материалы по важностям признаков в бустингах и методу LIME (и недавно слепила агентов на задачу интерпретировать модель): https://github.com/SadSabrina/XAI-open_materials
в) И хабр. Там, как правило, поясняю все туториалы лонгридом — https://habr.com/ru/users/sad__sabrina/
г) И канал про это всё: https://t.iss.one/jdata_blog — статейки, обзоры + какой-то опыт рисерч пути в режиме «я туда иду, куда-то пришла, дальше иду»
Вот, вдруг звезды сойдутся!)
Давно занимаюсь интерпретируемостью моделей. Помимо рисерча стараюсь делать много открытых материалов:
а) Мини курс на степике: https://stepik.org/course/228094 — бесплатный — про базовые методы и вообще интро в задачу
б) Банк туториалов по объяснению моделей — из свежего — туториалы по YOLO и GPT, также там есть материалы по важностям признаков в бустингах и методу LIME (и недавно слепила агентов на задачу интерпретировать модель): https://github.com/SadSabrina/XAI-open_materials
в) И хабр. Там, как правило, поясняю все туториалы лонгридом — https://habr.com/ru/users/sad__sabrina/
г) И канал про это всё: https://t.iss.one/jdata_blog — статейки, обзоры + какой-то опыт рисерч пути в режиме «я туда иду, куда-то пришла, дальше иду»
Вот, вдруг звезды сойдутся!)
GitHub
GitHub - SadSabrina/XAI-open_materials
Contribute to SadSabrina/XAI-open_materials development by creating an account on GitHub.
👍33🔥14❤8👎5
Forwarded from Кот-Обормот
Привет. Мне 14 лет, занимаюсь роботами и ИИ. Для одного проекта нужен был надёжный механизм прерывистого движения. В итоге, вместо ручного рисования шестерён, с вайбкодингом я сделал полноценный параметрический генератор самых разных мальтийских механизмов.
Там уже 17 различных параметров, экспорт STL и Fusion 360 Python-скрипта, просмотр в 3D и анимация движения.
Проект здесь: https://geneva-drive.onefile.space
Там уже 17 различных параметров, экспорт STL и Fusion 360 Python-скрипта, просмотр в 3D и анимация движения.
Проект здесь: https://geneva-drive.onefile.space
❤100🔥73👍20
Forwarded from Inemi Davos
Привет! В неделю пет-проектов)
https://seely.ru/ - MCP-сервер к Яндекс.Метрике и Яндекс.Вебмастеру. Задаете вопрос обычным языком, например:
- "Почему упал трафик на прошлой неделе?"
- "Какие страницы в шаге от топа?"
- "Где у меня ошибки индексации?"
ИИ сам достает реальные данные и дает конкретный ответ.
Базовые инструменты Метрики (трафик, отказы, конверсии, аудитория, устройства, рефералы) и Вебмастера (индексация, запросы, битые ссылки, сайтмапы, диагностика). Только чтение, нельзя ничего изменить или удалить в яндексе.
Скоро ещё добавлю туда же MCP для Google Search Console и Google Analytics.
https://seely.ru/ - MCP-сервер к Яндекс.Метрике и Яндекс.Вебмастеру. Задаете вопрос обычным языком, например:
- "Почему упал трафик на прошлой неделе?"
- "Какие страницы в шаге от топа?"
- "Где у меня ошибки индексации?"
ИИ сам достает реальные данные и дает конкретный ответ.
Базовые инструменты Метрики (трафик, отказы, конверсии, аудитория, устройства, рефералы) и Вебмастера (индексация, запросы, битые ссылки, сайтмапы, диагностика). Только чтение, нельзя ничего изменить или удалить в яндексе.
Скоро ещё добавлю туда же MCP для Google Search Console и Google Analytics.
Seely
AI SEO продвижение сайта — Seely
Подключите ChatGPT и Claude к Яндекс Метрике и Вебмастеру. SEO-рекомендации на основе реальных данных.
🔥33❤7