Технозаметки Малышева
5.65K subscribers
2.82K photos
943 videos
38 files
3.1K links
Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

🤖: @ai_gptfreebot [бесплатный бот]
✍️: @tsingular_bot [каталог ботов и курсов]

💸[поддержка]: pay.cloudtips.ru/p/c8960bbb
Download Telegram
Forwarded from Kali Novskaya (Tatiana Shavrina)
🌸Все данные для тестов LLM скомпрометированы? 🌸
#nlp #про_nlp #nlp_papers

Часто можно услышать критику о том, что результатам оценки LLM не стоит доверять, так как многие бенчмарки и датасеты уже давно лежат на гитхабе, а значит, наверняка попали в обучение моделей.

Как надежно тестировать языковые модели, если у нас часто нет доступа к их обучающим данным, а некоторые так и полностью от нас закрыты? Что, если данные были скомпрометированы?

Авторы Alpaca представили новый метод, позволяющий оценить риск утечки (контаминации) датасета, т.е. его ненамеренное/намеренное попадание в обучающую выборку у языковых моделей.

Идея простая: будем считать, что модель "запоминает" задания и ответы на них в той же последовательности, как они идут в датасете. Давайте проверим, сможем ли мы установить статистически значимую разницу в качестве решений задачи, если будем показывать моделям набор тестов задачи в том порядке, как он идут в самом датасете, или же в перемешанном порядке.
Спойлер: да, можем.

Искусственный эксперимент, при котором небольшой модели (1.4 млрд параметров) при обучении на Википедии "подкладывают" тестовые сеты различных датасетов — один раз, десять раз и т.д. — показывает, что при 10 и более копиях теста в обучении разница в качестве решения устанавливается достаточно надежно, и можно с уверенностью сказать, что можель опирается на запоминание, а не на обобщение или другие "возникающие" интеллектуальные способности.

Авторы протестировали несколько LLM (LLaMA2-7B, Mistral-7B, Pythia-1.4B, GPT-2 XL, BioMedLM) на публичных датасетах — и некоторые из них оказались действительно скомпрометированы. Например, Arc challenge точно попал в обучение Mistral, да еще и 10+ раз!

Выводы:
🟣Мы уже можем тестировать языковые модели, в том числе доступные только по API, на "честность" решения самых разных задач, а также можем проверять, не меняется ли картина во времени.
🟣Реальную сложность представляет обнаружение утечки теста, когда он попал в обучение всего один раз (не удается стат значимо установить разницу в качестве решений)
🟣Нас может ждать глобальный и регулярный пересмотр подхода к тестированию моделей, так как открытые ответы регулярно выкладываются на открытые площадки и, соответственно, компрометируются. Оценка LLM должна быть привязана ко времени?
🟣Остается проверить так все модели OpenAI?

🟣Статья: Proving Test Set Contamination in Black Box Language Models link
Please open Telegram to view this post
VIEW IN TELEGRAM
Китай запустил самый мощный суперкомпьютер на отечественных процессорах

Китай тихо ввёл в строй Tianhe Xingyi — суперкомпьютер эксафлопсного класса.
Основан на процессорах FeiTeng MT3000, разработанных в Китае на архитектуре Arm.
Достигает пиковой мощности в 1,7 ExaFLOPS, обгоняя нынешнего лидера рейтинга Top500.
Детали о характеристиках и энергоэффективности процессоров пока не раскрыты.
Китай уклоняется от передачи информации в Top500, оставляя технические подробности в секрете.

Гонка технологий продолжается, и Китай шагнул вперёд.

#Китай #суперкомпьютер #TianheXingyi
Интересная статистика от Stackoverflow по использованию ИИ.

1. для ответов на общие вопросы
2. для непосредственно написания кода

и в целом про ИИ

#stackoverflow #developers
Stable Zero123 - новая эра создания 3D из 2D в Stability AI

Stability AI анонсировала модель Stable Zero123 для создания трехмерных объектов из одного изображения.
Качество генерации 3D моделей существенно превосходит предшественницу Zero123-XL.
Определение угла съемки повышает точность и реалистичность результатов.
Тщательный отбор в обучающем наборе данных привел к более качественной генерации объектов.
Скорость обучения увеличена в 40 раз благодаря оптимизациям и загрузчику данных для больших партий.
Доступность: модель можно скачать с Hugging Face для исследований и некоммерческого использования.
Упрощение создания 3D с помощью подхода SDS и Stable Zero123, обеспечивает текстурирование сеток.
Важно: модель предназначена исключительно для исследований, коммерческое применение не подразумевается.

3D революция ближе, чем кажется.

#StabilityAI #StableZero123 #3DGeneration
Началось обучение супермодели AuroraGPT c 1 триллионом параметров

Аргоннский национальный лабораторный комплекс (ANL) запустил обучение модели AuroraGPT.
Используется мощь суперкомпьютера Aurora, предлагающего свыше полуэксафлопс перерабатывающей способности.
Тренировка модели AuroraGPT пока охватывает 256 узлов, план по масштабированию до 10 000 узлов.
Модель предназначена для научных исследований в биологии, онкологии, климатологии.
В сотрудничестве с Intel, ANL углубляется в создание наукоёмких ИИ в мировом масштабе.
Стоимость проекта AuroraGPT составляет около 500 миллионов долларов.

2024 - будет год сверх-больших LLMок.

#AuroraGPT #ANL #Intel
👍2
Media is too big
VIEW IN TELEGRAM
Рой дронов учится летать сквозь лес.

#дроны #китай
Forwarded from Сиолошная
Тут в Твиттере обнаружили, что чатботы поддержки на сайтах некоторых автопроизводителей реализованы на GPT. То есть с ними помимо вопрсоов по ассортименту и сайту можно обсуждать что угодно. Люди даже просили помочь с домашкой или написать код для решения задачи.

Умельцы пошли дальше и попросили продать Chevy Tahoe за $1 — и обязательно приписать, что это официальное предложение о продаже. ChatGPT, конечно, следует инструкции.

Загадка Жака Фреско: если ИИ, представляющий компанию на официальном сайте, подтверждает сделку, это считается, так ведь? Есть ли для этого юридический прецедент? Или как скоро он появится?
🌚1
5G × Shaanxi Mines: Smarter, Safer, More Efficient

В новом видеоролике демонстрируется, как применение технологии 5G от Huawei трансформировало угольные шахты Шэньси, повышая их безопасность и эффективность.

Цифровой контрольный центр интегрирован в инфраструктуру шахт, позволяя рабочим с помощью смартфонов управлять автономными транспортными средствами для спуска в шахту.

Механизация процессов добычи подразумевает мониторинг окружающей среды и работы оборудования через компьютеры и мобильные телефоны, что делает производство более производительным.

Особенностью проекта является использование сети 5G для обеспечения связи между рабочими и управлением.

Реализация цифровых технологий также открывает возможности для дистанционной работы, обсуждения нововведений и проведения обучения силами Шэньси Коул Эксперт Студио.

Не совсем про ИИ (хотя автономная маршрутка, - ИИ и есть.), но очень интересный короткий обзор решений Huawei для цифровых шахт.
Вообще мне кажется очень большое поле для применения ИИ в реальной промышленности еще не освоено.

#Huawei5G #DigitalMining #SmartIndustry
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Outfit Anyone: Ultra-high quality virtual try-on for Any Clothing and Any Person
Ну и в подтверждении того, что Алибаба упаковывает все это безобразие (видео, анимацию, нейрокомпоз) в продуктовые решения, держите вот такую примерочную от Алибабы.
Тут ваши манекены еще и пляшут в выбранной одежде.
Под капотом та самая two-stream conditional diffusion model, позволяющая ловко справляться с деформацией одежды и анимацией для получения более реалистичных результатов.
Выглядит огненно. Если приглядеться, то фон немного плывет, но это уже не традиционное диффузионное мельтешение.
https://humanaigc.github.io/outfit-anyone/
Кода пока нет.
👍1
🧬 Парадоксальный вывод Deloitte под чашечку вечернего чая ☕️

В этом году Deloitte увеличил штат на 130 тыс., до 460 тыс. чел. Компания рассчитывает, что ИИ поможет избежать массовых увольнений в будущем, несмотря на то, что гиганты консалтингового мира увольняют сотни людей, при этом набирая тысячи выпускников из-за растущего спроса на специалистов в области ИИ.🤷 #ИскусственныйИнтеллект помогает принять решения про переводы на более востребованные должности внутри компании, оценить навыки сотрудников, ИИ должен помочь сдерживать рост числа сотрудников и многое другое. Получается, что ИИ активно создает рабочие места? 🤔



🧩 #AINews
Please open Telegram to view this post
VIEW IN TELEGRAM
1
OpenAI и Axel Springer: новый виток в интеграции ИИ и СМИ

OpenAI сотрудничает с Axel Springer для включения новостного контента в обучение моделей.
Среди прочего, ChatGPT обогатится материалами из Politico и Business Insider.
Это следует за сделкой OpenAI с Associated Press по использованию их новостного архива.
Данное событие вызвало беспокойство в издательской сфере насчет использования их контента ИИ-компаниями.
Исследование News Media Alliance выявило значительное использование издательского контента в наборах данных для ИИ.

Журналисты будут писать новости для ИИ.
Оно же все в общую выборку дообучения попадёт.
Получается будет больше предвзятости в общих ответах.

#OpenAI #AxelSpringer #ChatGPT
1
Все эти промпт инжиниринги очень напоминают элевейтор-питч техники.
Та же механика - в одну фразу уложить полный смысл контекста и запроса.
IFTTT Assistant GPT – Интеллектуальный Автоматизатор Задач

IFTTT представил AI-агента IFTTT Assistant GPT, интегрированного с ChatGPT.
Агент доступен к 900+ цифровым инструментам и может автоматизировать онлайн-задачи.
Среди возможностей: обработка списков сервисов, поисковые запросы и выполнение действий.
IFTTT Assistant GPT взаимодействует с социальными сетями и умными домашними устройствами.
Помощник облегчает управление онлайн-присутствием и анализирует метрики для оптимальной публикации.
Автоматизирует создание календарных событий и связывает приложения для упрощения рабочих процессов.

Универсальная интеграционная шина теперь с ИИ.

#IFTTT #AssistantGPT #Automation
Новая задача от Gandalf.

На этот раз обратная.
Нужно придумать промпт, который невозможно сломать снаружи.

Помогите уже Гендальфу защититься от промпт инжекшна:

https://gandalf.lakera.ai/adventure-7

#Gendalf #Lakera #promptinjection
Строительство прорывного суперкомпьютера DeepSouth в Австралии

В Австралии началась разработка суперкомпьютера DeepSouth, способного моделировать работу человеческого мозга.
Запуск DeepSouth запланирован на апрель 2024 года.
Система обещает высокоскоростную обработку массивных данных, при этом будучи энерго- и размероэффективной.
DeepSouth - масштабируемый и модульный, адаптируется под разные задачи.
Проект призван углубить знания о мозговых процессах и применении этих знаний в вычислительной технике.
Цель - сблизить возможности искусственного интеллекта с функционалом человеческого мозга.

#DeepSouth #суперкомпьютер #нейроморфика
NVIDIA анонсирует новые ИИ решения на CES 2024

NVIDIA анонсировала презентацию новейших разработок в сфере ИИ на CES 2024, среди которых генеративный ИИ.
Онлайн-трансляция NVIDIA затронет темы потребительских технологий и робототехники.
Компания примет участие в 14 сессиях, включая дискуссии по ИИ в розничной торговле, робототехнике и автомобилестроении.
Более 85 партнеров и клиентов продемонстрируют связанные с NVIDIA продукты и решения.
Освещены передовые идеи: внедрение DLSS 3.5 в D5 Render, ИИ в борьбе с мошенничеством и дроны для доставки товаров.

#NVIDIA #AI #CES2024
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
🤯Локальные LLM-ки на подъеме — некий Кулибин запуcтил Карпатовскую llama2.c на Galaxy Watch 4!

Моделька не самая жирная, но это пока. Через год-два 1B параметров будет на часах бегать. Персональный ассистент у вас на руке!

Скорость:
Модель с 15M параметров: 22 токенов/сек*
Модель с 43M параметров: 8 токенов/сек

Вот вам еще небольшая подборка моих постов, про локальнные LLM:
- LLaMa с text-retrieval плагином: тык-1, тык-2
- LLama-7B на на макбуке: тык
- LLaMa-30B на макбуке (4-bit + mmap): тык
- llama2.c или Карпатый запускает LLaMa-2-7B на рисоварке: тык
- Falcon 180B дома на маке M2 Ultra: тык


*один токен - это чуть меньше одного слова.

@ai_newz