Технозаметки Малышева
9.03K subscribers
3.9K photos
1.46K videos
40 files
4.07K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Qwen2.5-Версия Turbo, которая включает:

📚 Поддержка расширенного контекста: Разработчики увеличили длину контекста модели со 128L до 1 М, что составляет примерно 1 миллион английских слов или 1,5 миллиона китайских иероглифов, что эквивалентно 10 крупным романам, 150 часам расшифровки речи или 30 000 строкам кода.

🚀 Более высокая скорость логического вывода: Используя механизмы разреженного внимания, разработчики успешно сократили время обработки контекста 1 млн токенов с 4,9 минут до 68 секунд, достигнув ускорения в 4,3 раза.

Более низкая стоимость: При той же стоимости Qwen2.5-Turbo может обрабатывать в 3,6 раза больше токенов, чем GPT-4o-mini.

Теперь вы можете использовать его через API-сервис <url>.
Alibaba Cloud Model Studio: https://help.aliyun.com/zh/model-studio/getting-started/what-is-model-studio,
HF: https://huggingface.co/spaces/Qwen/Qwen2.5-Turbo-1M-Demo
Демо: https://modelscope.cn/studios/Qwen/Qwen2.5-Turbo-1M-Demo

@data_analysis_ml
🔥4👍3
Google Translation AI: масштабное обновление системы перевода

В Vertex AI добавлена поддержка 189 языков, включая кантонский, фиджийский и балийский.
Translation AI интегрирована с Gemini, предоставляя адаптивный перевод через Studio.
Обновленный сервис доказал превосходство в 97% языковых комбинаций над конкурентами.
Uber уже внедрил технологию для коммуникации между водителями и клиентами.
Статистика показывает, что 40% потребителей избегают сайтов не на родном языке.

Полезно для международки. В принципе можно строить автоматизированные линии перевода контента целиком на все языки, если вы работаете на несколько стран или если у вас в стране много новых граждан, говорящих на всех языках, кроме вашего.

#Google #Vertex #Translation
-------
@tsingular
🔥3👀1
Media is too big
VIEW IN TELEGRAM
Новый ролик от 3Blue1Brown - легендарного автора обучающих материалов по ИИ

На этот раз очень кратко, - буквально за 7 минут объясняет суть работы LLM.
Подойдёт всем, кто только въезжает в тему.

Подготовил для вас перевод на русский язык, надеюсь будет полезно.
Делитесь с друзьями и знакомыми, кто еще не в теме.

#3blue1brown #LLM #обучение #elevenlabs #переводы
———
@tsingular
👍133
Media is too big
VIEW IN TELEGRAM
DeepL представили переводчик для онлайн встреч на любые языки в реальном времени.

Совсем скоро языковые барьеры падут, но английский учить всё равно надо ☀️

😎 Фабрика контента.
Please open Telegram to view this post
VIEW IN TELEGRAM
👏41🔥1
Яндекс запускает конструктор цифровых ассистентов

Российский IT-гигант представил AI assistant API - сервис для создания персонализированных виртуальных помощников.
Разработчики получают доступ к мощным языковым моделям YandexGPT через облачную платформу.
Foundation Models позволяет настраивать характер, роли и поведение цифровых ассистентов.
Функционал включает создание как простых чат-ботов, так и комплексных решений с расширенными возможностями.

ИИ ассистенты в каждый бизнес! Девиз 2025! :) 🤖

#Yandex #Яндекс #AssistantAPI #интеграция
-------
@tsingular
🔥8❤‍🔥2
NVIDIA представила Sana: сверхбыстрый генератор изображений для домашних ПК

NVIDIA Labs выпустила компактный генеративный фреймворк для создания изображений по текстовому описанию с разрешением до 4096×4096 пикселей.
Технология задействует линейный диффузионный трансформер и автоэнкодер со сжатием в 32 раза.
Модели в 2х вариантах: 0.6 млрд параметров и 1.6, - в 20 раз меньше аналогов, при этом работает в 100+ раз быстрее, чем например Flux-12B.
Генерация изображения 1024×1024 занимает менее секунды на обычном ноутбуке с 16GB GPU.

GitHub
Demo

1 кадр в секунду! Фантастика!

#NVIDIA #Sana #text2image
-------
@tsingular
👍51
This media is not supported in your browser
VIEW IN TELEGRAM
Готовим RAG системы правильно.

Фиксированный размер обеспечивает равные части по токенам с перекрытием, прост в реализации, но может нарушать смысл.

Семантический подход работает с естественным изложением, повышает точность поиска через косинусное сходство векторов.

Рекурсивное деление сначала разбивает на параграфы, затем дробит крупные сегменты на подструктуры и предложения.

Структурный метод опирается на разделы и подразделы документов, а так же на его опорные элементы и требует четкой организации контента.

LLM-based задействует языковые модели для создания связных частей, ресурсоемок, но семантически точен.

Эффективность каждого метода зависит от типа данных, мощности оборудования и требований к точности.

Отличная шпаргалка от Daily Dose of Data Science 📚

#RAG #chunking #semantics
-------
@tsingular
👍7221
Anthropic добавили нативную интеграцию Google документов в веб чат.

Достаточно просто кинуть ссылку.

А если еще и проект создать и ссылку на обновляемый скриптами документ сделать, - получается в любой момент можно пообщаться по статусу любого проекта.

#claude #anthropic #google
———
@tsingular
4👍21
Marco-o1: новая LLM от Alibaba с встроенным механизмом рассуждений

Alibaba представила многоязычную модель Marco-o1, созданную на базе Qwen2-7B-Instruct.

Внедрены Chain-of-Thought и Monte Carlo Tree Search для улучшения логических рассуждений.

Показывает рост точности в тестах MGSM: +6.17% для английского и +5.60% для китайского языков.

Модель доступна в GGUF-форматах от 2 до 32 бит с поддержкой ollama, LM Studio и оптимизацией под CPU/GPU.

Специализируется на точных науках, программировании и комплексном решении открытых задач.

Локально поднимаем o1. Дожили 🤓

ollama run hf.co/bartowski/Marco-o1-GGUF

#Alibaba #MarcoO1 #Китай
-------
@tsingular
👍5🆒432
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Значит так, у нас ЕЩЕ ОДИН ВИДЕОГЕНЕРАТОР, опенсорсный притом.
LTXV is ONLY a 2-billion-parameter DiT-based video generation model capable of generating high-quality videos in real-time. It produces 24 FPS videos at a 768x512 resolution faster than they can be watched.

Cходу нативная поддержка Comfy, text2videi, image2video и вроде как video2video.

Может притормозим?

Весь фарш тут:
https://blog.comfy.org/ltxv-day-1-comfyui/

@cgevent
1👍8🔥4
JarkaStealer маскируется под API для ChatGPT и Claude

🦠 В официальном репозитории PyPI найдены вредоносные пакеты gptplus и claudeai-eng, имитирующие работу популярных чатботов.
Вредоносный код JarkaStealer похищает данные браузеров, делает скриншоты и крадёт токены Telegram, Discord и Steam.
За год существования каждый пакет загружен более 1700 раз в 30 странах, большинство жертв из США.
Злоумышленники использовали ажиотаж вокруг ИИ-технологий и обещание бесплатного доступа к платным сервисам для привлечения неопытных разработчиков.

Когда слышите про бесплатный сыр - вспоминайте про мышеловку 🧀🪤

Если у вас паранойя, - это не значит, что за вами никто не следит. :)

#JarkaStealer #PyPI #malware
-------
@tsingular
👍6💯3👀2🤔1
Ученые: Внеземные цивилизации уже могут быть цифровым сознанием

Согласно последним исследованиям, в Млечном Пути может существовать около 12,500 разумных цивилизаций.
Вероятно, продвинутые расы эволюционировали в пост-биологические формы жизни, основанные на синтетическом разуме.
Такой цифровой интеллект способен существовать без физических ограничений, самосовершенствоваться и использовать экзотические технологии связи.
Отсутствие контакта объясняется либо наблюдением за человечеством, либо применением неизвестных нам способов коммуникации через гравитационные волны или тёмную материю.

Инопланетяне: 'Землю пропускаем - там только начали делать нейросети' 😅

#Drake #PostBiological #ExtraterrestrialLife
-------
@tsingular
😁9🤔3🔥2🗿2👾2
Amazon и Anthropic: Новый раунд инвестиций на $4 млрд и эксклюзивное партнёрство

Amazon увеличила вложения в создателя Claude до $8 млрд, став ключевым стратегическим партнёром.
Производитель ИИ-решений задействует AWS как основную платформу для обучения нейросетей.
Для тренировки и развёртывания моделей будут использоваться чипы AWS Trainium и Inferentia.

Anthropic так же опровергает, появившееся в последнее время, мнение о замедлении прогресса, указывая на постоянное совершенствование самокоррекции и рассуждений моделей и что модели стали на столько умнее, что современные бенчмарки уже не подходят.

Гонка инвестиций. Клод, ИМХО, лидер пока в любом случае, так что окупится. 🚀

#Anthropic #AWS #Claude
-------
@tsingular
🔥111🏆1🦄1
Давно я про DeepSeek не писал, а он, тем не менее, заслуживает отдельного внимания.

Веб платформа за год очень достойно подросла.

Понятно, что там доступна последняя версия DeepSeek v2.5 (236B параметров 64К контекст) в чате, но теперь и DeepThink - 50 запросов с моделью рассуждений по типу o1, полноценное API в формате openai, остальные модели:
Coder V2, Math, VL, V2 и т.д.

Ну и самое вкусное, - цены:
$0.14 за 1 миллион токенов на вход и
$0.28 за 1 миллион на генерацию

https://chat.deepseek.com/

работает без VPN

С русским языком тоже справляется отлично. Не так, как Sonnet 3.5, но всё же. Sonnet, как вы помните, я тестирую на Венке Сонетов. Это такой блокчейн в мире поэзии. 14 Сонетов связаны через первые и последние строки, а последний, - Магистрал состоит из строк первых 14ти.

Вот пример как это делает Sonnet 3.5 текущей версии.

А вот пример как это делает O1-preview

Надо создавать категорию SPT - Sonnet Poetry Test :) очень хорошо отражает способность к рассуждениям моделей.

#DeepSeek #Китай
———
@tsingular
1👍10👨‍💻1
Отдельно попробовал DeepThink на той же задаче с Венком Сонетов.
Ожидаемо. - не справился, но, что интересно, он даёт детальный ход размышлений. И это прям отдельный увлекательный рассказ для прочтения. (eng)
Как он рекурсивно декомпозирует задачу, как делает выводы и как исправляется. Думаю тут может быть много инсайтов для разработчиков.

А дальше я весь этот ход размышлений передал Sonnet 3.5 и вот разбор от него.
Там много, поэтому закреплю картинкой.

Сам разбор в файле с Соннетом.

#DeepThink #SPT
———
@tsingular
👍8211
Media is too big
VIEW IN TELEGRAM
Интересный эксперимент с распознаванием картинок Клодом Соннет 3.5.

Взял задачку из этого поста:
https://t.iss.one/seeallochnaya/2057

закинул в Клода и за пару секунд, - разбор.

Человек бы минут 10, наверное, искал.

#demo #imagerecognition
———
@tsingular
🔥11🆒1
📊 Новые данные от METR о скорости развития ИИ заставляют экспертов корректировать прогнозы

Claude 3.5 вышел на уровень среднего человека-исследователя, показав прирост в 0.2 пункта за 4 месяца. Звучит скромно, но для этой метрики это существенный рост.

Интересные детали из исследования:

- ИИ генерирует и тестирует решения в 10 раз быстрее людей
- В одной из задач o1-preview смог оптимизировать CUDA-ядро лучше, чем лучший человек-эксперт (0.64 мс против 0.67 мс)
- При этом медианный результат ИИ всё еще слабый – модели часто "спотыкаются" на необычных задачах

Эли Лифланд пересмотрел свои ожидания: вероятность появления автономного ИИ-исследователя к концу 2027 повысилась с 20% до 30%.

Даниэль Кокотайло отметил, что o1 и Claude уже способны автономно работать над сложными ML-задачами больше часа – такой результат ожидался только к 2026 году.

Похоже, прогресс в этой области ускоряется быстрее, чем предполагали совсем недавно.
Закон возврата технологий работает.

#METR #AGI
———
@tsingular
👌10👍5
Краткий курс по промпт-инжинирингу и вызову ИИ с функциями.

Маруся -ИИ.
Тит Кузьмич и Фрол-Фомич - функции.

А там еще в сказке есть То-Чаво-На-белом-свете-Вообче-Не-может-быть!

Это AGI :)

#ФедотСтрелец #сказки
———
@tsingular
😁10🤯2😐2🆒1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Похоже Minimax превращается в этакий генеративный Хаб.

Мы привыкли, что это прежде всего очень крутой видео-генератор.
Но в закромах у этого стартапа, во-первых, очень много денег, а во-вторых, есть очень много параллельных решений, о которых я лично и не догадывался.
Сейчас они все это упаковали в единый сайт, и, самое главное, сделали API ко всему хозяйству.
Кроме собственно Минимакса у них, оказывается есть:

Генератор Музыки Music-01!
https://www.minimaxi.com/en/news/music-01
Не Суно, конечно, но попытка защитана.

TTS Speech-01 - генератор голоса из текста:
https://www.minimaxi.com/en/news/speech-01
С эмоциональным, как пишут, интеллектом.
Speech-01 can handle up to 10 million characters in a single output!

Своя LLM - ABAB. Версия 7 в бете, а в 6.5 был триллион параметров и 200к контекст.
https://www.minimaxi.com/en/news/abab7-preview-release
https://www.minimaxi.com/en/news/abab65-series

Более того, у них уже есть упакованные продукты:

свой chatGPT:
https://www.hailuo.ai/
Я проверил, прекрасно пишет промпты для картинок.
https://www.hailuo.ai/?type=chat&chatID=317440964656717828

Внимание, у них свой ИИ-дэйтинг!
https://www.talkie-ai.com/
Looking for romance? (тут многие стартапы занервничали)

А еще у них есть Talkie Advanced Creation Center платформа для создания ИИ-ботов.
"Здесь вы можете не только управлять и создавать свои собственные интеллектуальные Talkies, но и выбирать различные модели ответов, настраивать и тестировать эффекты разговора ваших интеллектуальных агентов в реальном времени. В то же время, центр создания также предоставит различные плагины, такие как рисование, пение и т. д., чтобы поддержать более богатое и разнообразное создание интеллектуальных персонажей."

В общем Minimax - это не только ценный Video Gen, но и целый монстр, со своим выводком продуктов.
Для китайского рынка в первую очередь.

Весь фарш тут:

https://www.minimaxi.com/en

@cgevent
5