Технозаметки Малышева
8.83K subscribers
3.88K photos
1.45K videos
40 files
4.04K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Google: обзор инновации в AI за 2023 год

Bard – инструмент для творчества.
Модель PaLM 2 – продвижение в сложных рассуждениях.
Imagen Editor – манипуляции с генеративными изображениями.
Deep Aligner – улучшение языковых навыков.
Модель Lyria – новаторство в генерации музыки.
Gemini владеет текстом, звуком, изображениями и видео.
Transformer помогает в зрении, звуке, биологии.
Обучение языковых моделей с новым алгоритмом.
Prequal – балансировщик запросов к серверу.
Алгоритмы для кластеризации и графов усовершенствованы.
Улучшение рекомендательных систем Google.
Chrome Privacy Sandbox – защита конфиденциальности.
Расширенное прогнозирование наводнений в 80 странах.
Новые планы эвакуации от лесных пожаров.
Модели погоды на более долгий срок.
Улучшения в клиническом уходе и обработке мед. данных.
Новая карта генома и предсказание биомаркеров.
Прогресс в квантовых компьютерах и коррекции ошибок.

#Google #AI #Innovation
MidJourney V6

В общем, цифровое искусство от ИИ, считаю, победило в этом году.
Дальше - повышение скорости, еще больше точности и перевод всего это в видео в течение пары лет.
Не очень понятна роль человека уже.
Ну и дальше так же будет во всех остальных областях.

запрос был:
кибермозг управляющий планетой

Highres в комментарии

#MJv6 #midjourney
AI_smart_city.pdf
22.1 MB
Эффективные отечественные практики на базе технологий искусственного интеллекта в «умном городе»

Интересный детальный отчёт о развитии систем на базе ИИ в РФ 2023

#аналитика #рф
______
Подпишитесь: @tsingular
This media is not supported in your browser
VIEW IN TELEGRAM
PowerInfer, aka как гонять LLM-ки быстрее lamma.cpp (по крайней мере на Linux авторы демонстрируют заметное ускорение, чего нельзя пока сказать о Mac OS). Такой эффект происходит за счет предзагрузки на GPU только так называемых hot-activated нейронов, и расчета на CPU cold-activated нейронов. В общем то основная суть деления на такие холодные и горячие – это то, как при генерации активируются разные нейроны в трансформере исходя из входной последовательности токенов

🖥Репозиторий
Please open Telegram to view this post
VIEW IN TELEGRAM
🧬 Все нейронки в одном месте. В библиотеке собрали больше 3400 проверенных ИИ-инструментов — от работы с текстом до генерации логотипов. Эдакий Каталог Каталогов Aixploria.

Чтобы найти нейросеть под свою задачу, просто выберете категорию и увидите целый список. На один клик по названию появится описание, а на второй — откроется сайт. Суперкаталоги становятся трендом.

🧩 #КаталогНейросетей
🔥1
OpenPipe обходит GPT-4 с новой моделью Mistral 7B

OpenPipe разработал модель Mistral 7B Fine-Tune Optimized, превосходящую GPT-4.
GPT-3.5 и GPT-4 эффективны в различных задачах, но не идеальны в глубоком анализе специализированных проблем.
Fine-tuning помогает модели более детально осваивать конкретные задачи и разрабатывать решения.
Использование тестового набора из реальных пользовательских задач позволило точно оценить модели Mistral.
Слияния моделей Hermes Neural и Metamath Cybertron Starling показали впечатляющие результаты.
После 9000 сравнений, одна из слиянных моделей оказалась эффективнее GPT-4 на тестах.
Mistral Fine-Tune Optimized теперь доступна на Hugging Face и станет базовой моделью в OpenPipe.
OpenPipe анонсировал разработку ещё более мощных моделей.

Fine-tuning рулит

#OpenPipe #Mistral7B #AI
В Калифорнии открывается первый ресторан с полным роботизированным обслуживанием

В Калифорнии стартует первый в мире ресторан под управлением роботов и ИИ.
Роботизация охватывает весь процесс: от приема заказов до приготовления пищи.
Использование PopID станций и оплата через распознавание лица упрощают взаимодействие с клиентом.
Экономия на зарплате персонала позволяет больше инвестировать в качество: представлены бургеры из мяса Wagyu.
Присутствие человека сохраняется на финальных этапах обслуживания: упаковка и клиентский сервис.

Инновации изменяют ресторанный бизнес прямо на глазах.

#Роботы #ИИ #безлюдноепроизоводство
RAG техники: разбор различных сценариев

Алгоритмы RAG позволяют получать более точные ответы.

Используют библиотеки faiss, nmslib, annoy для создания индексов документов.

В поиске контекста применяют извлечение фрагментов и их автоматическое объединение.

Комбинируется семантический поиск и поиск по ключевым словам.

Контекст сжимают с помощью ContextChatEngine и CondensePlusContextMode.

Агенты сравнивают решения и управляют множеством документов.
LlamaIndex обеспечивает гибкий режим чата с поддержкой агентов.

Маршрутизаторы запросов направляют их к нужным индексам для обработки.
Ответы создаются через суммирование и объединение вариантов.

Техники донастройки DL-моделей повышают качество ответов.
Фреймворки Ragas и Truelens оценивают фактическую точность и полноту.

Производительность пока главная проблема RAG-систем.

#RAG #LLM #ContextChatEngine
Rigetti Computing запустила 9-кубитный квантовый процессор Novera.

Аппарат основан на архитектуре нового поколения – Ankaa-class.
Благодаря настраиваемым связям и квадратной решётке, Novera обеспечивает плотное соединение и быстрые 2-кубитные операции.
Процессор изготавливается на собственном производстве Rigetti – Fab-1, первом в отрасли интегрированном центре производства квантовых устройств.
Устройство предназначено для работы с гибридными квантовыми алгоритмами, калибровкой и коррекцией ошибок.
Novera совместим с коммерческими холодильными системами и системами управления.
Квантовый процессор доступен для заказа по цене от $900,000 и отгружается в течение 4-6 недель после подтверждения заказа.

Прорыв в квантовых технологиях.
До взлома всех паролей в мире осталось 3...2...1...

#Rigetti #NoveraQPU #QuantumComputing
Еще одно исследование по RAG

RAG необходим для эффективного использования LLM, особенно в наукоемких задачах.
Предлагаются различные пути его развития и оптимизации.

Описаны три парадигмы:
1. Naive RAG: базовая реализация.
2. Расширенный RAG: включает сложные методы поиска и генерации.
3. Модульный RAG: обеспечивает гибкость и интеграцию различных методов.

Основные компоненты:
- Retriever: извлекает соответствующую внешнюю информацию.
- Генератор: генерирует ответы, используя полученные данные.
- Плагины: расширение возможностей RAG.

Оценка RAG: представлены два метода оценки, ориентированные на ключевые показатели и способности. Также представлены новейшие системы автоматической оценки.

Будущие направления исследований:
1. Вертикальная оптимизация: повышение глубины и качества компонентов RAG.
2. Горизонтальная масштабируемость: расширение применимости RAG в различных областях.

#RAG
На пути к массовому производству малых реакторов

В Саскачеване демонстрируется микроядерный реактор eVinci от Westinghouse.
Саскачеван занимает второе место в мире по производству урана.
Микрореактор eVinciTM способен вырабатывать до 5 мегаватт электроэнергии и 13 мегаватт тепла.
Первопроходец – eVinci может стать первым передовым ядерным реактором в регионе.

Технология выделяется безопасностью, низким риском распространения и отсутствием нужды в охлаждающих системах.

скоро в каждом подводном датацентре.
Или не скоро.. так пишут, конечно - ЕСЛИ сроки не поползут :)

#Westinghouse #eVinci #NuclearEnergy
🔥1
Google DMD: Новая модель для оценки расстояний

Исследователи Google представили новую модель DMD для оценки глубины, которая превосходит текущие модели.

Основные особенности:

- DMD использует диффузионные модели для оценки метрической глубины без учителей по одному кадру, подходит для общих сцен.

- добавление FOV (Field of View) параметра в набор обучающих данных дали прирост в точности распознавания.

- рекомендуют добавлять глубину по логарифмической шкале.

- v-параметризация значительно ускоряет скорость инференса в денойзе.

- DMD показывает значительно меньшую ошибку оценки глубины по сравнению с ZoeDepth на всех восьми тестах.

- DMD выдаёт на 25% меньше ошибок на примерах в-помещениях и на 33% меньше на уличных, по сравнению с ZoeDepth.

Reddit

#Google #DMD #DepthEstimation
Интересный пример как 1 знак полностью меняет картинку

В разных языках буква «о» кодируется как разные символы Юникода, которые для людей по-прежнему выглядят одинаково.

Например, корейская «о» — это символ Юникода U+3147, а арабская «о» — это символ Юникода U+0647.

Когда мы просим DALLE-2 сгенерировать «фото актрисы» с разными вариантами буквы «о», мы получаем изображения актрис разных рас.

Модель преобразования текста в изображение, такая как DALLE-2, была обучена на данных из Интернета и научилась связывать арабский текст, содержащий символ Юникода U+0647, с изображениями арабских актрис.

Подобная замена символов подходит для prompt injection атак, когда тщательно разработанная строка может вызвать вредные или нежелательные генерации.

В этом случае человек не заметит, заменили ли мы типичную букву «о» на арабскую, корейскую или индийскую букву «о» в запросе.

#bias #promptinjection
🔥1