Нейроскептик
24K subscribers
602 photos
177 videos
549 links
Нейросети, ИИ, NLP, ML, Python и всё что рядом. Без гнева и пристрастия, но со здоровым скепсисом.

Для контактов @markov117
Download Telegram
Forwarded from rizzearch
TokenFormer: Rethinking Transformer Scaling with Tokenized Model Parameters

yet another attempt на упрощение скейлинга трансформеров

для этого решили авторы заменить все линейные проекции на кросс аттеншн. по сути это значит, что они заменили все млп в модели на аттеншн-лайк механизм, где в качестве запросов выступает неспроецированный инпут X, и назвали это pattention

было и стало (f - нелинейность)

O = f(X W_1) W_2

O = f(X K^T) V

плюс перед нелинейностью GeLU добавили л2 нормализацию по строчкам

оттого, что keys & values являются обучаемыми параметрами, а не проекциями инпута, и можно скейлиться меньше по оверолл количеству параметров и токен-параметр интеракциям (по заверениям авторов, но опять-таки с точки зрения формулы это частный случай млп)

а скейлиться лучше в увеличении параметров вот так: было n x embedding_dim. хотим увеличить → делаем (n+m) x embedding_dim, где инитим новые параметры нулями или как-то еще

нлп и вижн трансформеры (в частности особенно pythia) обыгрывает при примерно том же наборе параметров, так еще и флопсов меньше требуется

идея довольно интересная но при этом немножко топорная. смущает разве что отсутствие аблаций по типу “давайте попробуем обычный гелу без какой-либо нормализации”.

👀LINK
Forwarded from Политджойстик / Politjoystic  (Марат Баширов)
RuStore стал лауреатом премии Russian Creative Awards 2024. Российский магазин приложений был признан самым инновационным проектом года.

RuStore был создан VK при поддержке Минцифры в ответ на ограничения в 2022 году. За два с половиной года российский магазин приложений обошел американский AppStore по количеству установок и достиг отметки в 80 миллионах устройств и 40 тысяч приложений. Ежемесячная аудитория RuStore за этот же период превысила 40 млн пользователей. Этот показатель более чем в 2 раза превысил аудиторию ближайшего конкурента среди альтернативных магазинов приложений. Тем самым RuStore стал качественным и наглядным примером реального импортозамещения в диджитале за последние два года
This media is not supported in your browser
VIEW IN TELEGRAM
Tesla Optimus научился ловить мячики одной рукой

Не каждый человек может похвастаться такой ловкостью

Подписаться на Нейроскептик
This media is not supported in your browser
VIEW IN TELEGRAM
Примерно три четверти взрослых граждан в России используют интернет, отметил Владимир Путин на пленарном заседании форума "Россия зовет!".

Также Президент подчеркнул, что количество занятых в IТ-сфере выросло на 8,1 % по сравнению с предыдущим годом. А уровень цифровизации финансовых услуг в России превышает общемировой, что подтверждает высокую технологичность этой сферы отечественной экономики, её устремленность в будущее, умение ставить большие цели и работать на опережение.

Подписаться на Нейроскептик
🔔 Мошенники стали применять ИИ для совершенствования своих схем
 
Среди новых методов, указывают аналитики, – создание дипфейков с участием знаменитостей для продвижения мошеннических криптовалютных схем и манипуляции на YouTube.

Одной из таких афер стала подделка, связанная с тестированием SpaceX Starship, на которой преступники похитили более 1,4 млн американских долларов.

Член комиссии по поддержке ИТ-индустрии Общественного совета при Минцифры России Владимир Маслов назвал единственный способ защитить себя от такого вида мошенничества ⬆️

#ОС_Минцифры #дипфейки #кибербезопасность

↔️ Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
Несмотря на рост числа сотрудников IT-компаний, преподающих в вузах их всё равно, не хватает чтобы утолить кадровый голод в отрасли

В 2024 году в российских вузах преподавали по 800 - 1000 действующих сотрудников крупных IT-компаний что составило примерно 7% всех сотрудников. Чаще всего компании привлекают своих специалистов к преподавательской деятельности для того, чтобы оперативно пополнять команды выпускниками, заточенными под свой стэк. Правда на рынке труда больше всего не хватает качественных middle и senior специалистов, для подготовки которых нужна более основательная подготовка и опыт работы. Также отмечается, что специалисты, получившие фундаментальное образование, уезжают за рубеж. В России же остаются те, кто закончил краткосрочные курсы.

Для решения проблемы с нехваткой кадров, Минцифры планирует сделать включение аккредитованных IT-компаний в образовательный процесс обязательным условием для сохранения ими льгот. Безусловно, вовлечение ещё большего числа практикующих IT-специалистов в преподавательскую деятельность может способствовать увеличению качественных выпускников с уровнем компетенций middle и senior. Но ещё нужно думать о том, как мотивировать талантливых специалистов оставаться в России. Пока многие из них мечтают свалить за бугор набравшись здесь опыта

Подписаться на Нейроскептик
Forwarded from rizzearch
Learning Local Equivariant Representations for Large-Scale Atomistic Dynamics

Что ж, сегодня Allegro от Гарварда. Наверное единственный метод, который классно скейлится между нодами GPU. Давайте разберемся как они смогли сделать симуляцию на 100 миллионов атомов 🐹

Собственно побуждение было вызвано плохим скейлиногом GNN из-за роста receptive field с количеством слоев, с чем также связано огромное количество вычислений между нодами. Allegro использует тензорные умножения и сферические функции - базу для сохранения векторных симметрий и скалярных инвариантностей. В статье используется обмен информацией между парами атомов через сумму взвешанных тензорных умножений между репрезентациями и сферическими тензорами. Свойство билинейности позволяет нам делать расчет более эффективно, разделяя операцию на фичи пары атомов и фичи соседей

Но, что супер важно, так это локальность операции агрегации. Все парные индексы имеют один и тот же центральный атом для конкретного атома. Это отличает Allegro от обычных GNN с их плохим скейлингом

Касательно экспериментов все очень необычно. У нас есть база типо QM9 / MD-17, но что интересно так это большие системы. Для того, чтобы пофлексить скейлингом авторы симулируют несколько крупных белков, а также твердотельный литий-ионный электролит на 100 миллиона атомов и оболочку ВИЧа на 44 миллиона соответственно

Хотя, как ни странно, для небольших систем уже сейчас существуют методы, которые стабильно бьют Allegro по точности. Оно не удивительно, ведь внутри стандратные MLP. Поэтому юзать есть смысл, только если у вас огромные молекулы или кристаллы

👀 LINK 1, LINK 2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ впервые будет использован для сбора и обработки вопросов к прямой линии президента РФ

"Фактически к моменту выхода на прямую линию - пресс-конференцию президент будет иметь понимание о всех вопросах, которые поступили", - сообщил пресс-секретарь главы государства Дмитрий Песков.

С помощью LLM GigaChat будут детально разобраны все вопросы, "мы будем понимать проблемы в каждом регионе, в каждом городе, мы будем понимать возраст тех, кто обращается, будем понимать, о каких именно проблемах идет речь - отдельно взятая проблема с малейшими аспектами", - пояснил представитель Кремля.

На его взгляд, использование ИИ - "это очень важный шаг, очень важная технология, которая будет дорабатываться в процессе исполнения всех функций".

Ежегодная большая пресс-конференция и прямая линия с президентом России Владимиром Путиным состоятся в совмещенном формате 19 декабря.

Подписаться на Нейроскептик
Новый информационный портал Карта Цифровой России, объединяющий российских ИТ-разработчиков, их продукты и решения запускает партийный проект "Цифровая Россия"

"Карта Цифровой России" — это инструмент для удобного поиска и выбора отечественного программного обеспечения, программно-аппаратных комплексов, робототехнических и других передовых технологий.

Портал предоставляет доступ к проверенным решениям, которые охватывают все отрасли экономики — от промышленности и медицины до образования и культуры. Для его разработки было использовано исключительно российское программное обеспечение, что позволяет обеспечить полную защищенность размещенных на платформе данных.

Зарегистрироваться на портале участники смогут через Госуслуги, что также гарантирует безопасность и актуальность информации.

На платформе есть обширный каталог ИТ-решений, включающий структурированную информацию по каждому продукту, интерактивную карту для поиска решений по регионам и отраслям, профили российских ИТ-компаний с подробной информацией и контактами разработчиков, а также раздел новостей, где представлены актуальные данные о новых разработках и событиях в сфере цифровой трансформации.

"Карта Цифровой России — это не просто платформа, а стратегический шаг к интеграции инноваций в экономику России", отметил член комитета Госдумы по информполитике, информтехнологиям и связи, федеральный координатор "Цифровой России" Антон Немкин.

Пока портал находится в стадии наполнения и не весь функционал открыт и ещё хочется добавить, что собрать все ИТ-компаний на карте нашей огромной страны очень актуальное решение

Подписаться на Нейроскептик
Глава Минцифры Максут Шадаев на Правительственном часе в Совете Федерации рассказал о итогах работы в цифровой среде и о планах на будущее. А их у Минцифры громадьё.

Например, планируется к 2027 году сформировать основу собственной высокотехнологичной низкоорбитальной группировки (аналог Starlink Маска). 300 аппаратов должны обеспечивать быстрый и дешёвый интернет на территории всей страны. В 2030 году 16 городов будут обеспечены инфраструктурой 5G, это примерно 16-17 млн абонентов, а к 2036 году уже 99% домохозяйств должны иметь возможность доступа к скоростному интернету.

За последние 4 года получили доступ к интернету более 10 млн домохозяйств. Были построены две волоконно-оптические линии связи, соединившие Кингисепп и Калининград, Камчатку и Чукотку. Также были подключены к интернету более 100 тыс. соцзначимых объектов, из них почти половина — это школы.

Видно, что современный высокоскоростной интернет развивается в России полным ходом, в том числе во всех новых регионах.

Подписаться на Нейроскептик
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня Владимир Путин, выступая на пленарном заседании конференции "Путешествие в мир искусственного интеллекта" подчеркнул, "что наличие собственных разработок нового поколения ИИ – одно из ключевых условий научного, технологического и что важно, мировоззренческого суверенитета нашей страны".

Стоит отметить, что как будут работать поведенческие алгоритмы модели ИИ, зависит во многом от данных, на которых её обучили. И президент это отчётливо понимает, "алгоритмы, принципы работы ИИ закладывают, безусловно, во всяком случае пока и в основном люди, ориентируясь на определённые ценности, язык, образы, культуру, понимание истории, традиции, на национальные особенности и интересы. Чтобы определять будущее, судьбу России, мы должны сами, самостоятельно создавать такие технологии", заявил он.

Путин также добавил, что знания моделей должны опираться на прочный фундамент, созданный выдающимися отечественными философами, светскими и религиозными мыслителями, историками, лингвистами, признанными авторитетами в сфере гуманитарного и культурного знания. И конечно, учёными, математиками, специалистами в области кибернетики, информатики.

Действительно, по-другому быть не должно. Если использовать ИИ обученный на ложных знаниях о нашей стране, истории и обществе в целом, то можно получить огромные проблемы, а не возможности, потерять связь с реальностью и не найти истины. Ведь знание и истина — это взаимосвязанные понятия, которые дополняют друг друга.

Международная конференция по ИИ и МО Artificial Intelligence Journey 2024 проходит в Москве с 11 по 13 декабря. В ней принимают участие разработчики и представители бизнеса из России, Китая, ОАЭ, Индии, Индонезии, других государств.

Подписаться на Нейроскептик
Media is too big
VIEW IN TELEGRAM
На второй ежегодной премии "Герои Рунета-2024" подвели итоги года и вручил премии. Эксперты и пользователи Рунета отметили людей, персонажей и явления, которые составляют картину общественно значимых событий и достижений в российском сегменте Сети за 2024 год.

Одну из номинаций, а именно "Вклад в развитие нового поколения научно-образовательных ресурсов Рунета" взяли РУВИКИ и Яндекс. Компании внедрили в российскую цифровую энциклопедию большую языковую модель Yandex GPT для умного поиска инфы. Теперь в РУВИКИ генеративный ассистент находит нужные статьи и дает по ним развернутые ответы.

Кроме этого, премию получил RUTUBE за "Умение слушать своих зрителей", а порталу Госуслуги вручили награду "За успешно реализованную концепцию сервисного государства". Отрадно, что российская IT сфера продолжает развиваться несмотря ни на что и ни на кого, а награды находят своих героев.

Per aspera ad astra.


Церемония вручения премии прошла в Москве на площадке "Кибердома". Учредителем премии выступает Региональный общественный центр интернет-технологий (РОЦИТ).

Подписаться на Нейроскептик
Совместную лабораторию ИИ, анализа данных и моделирования Центрального университета и Института AIRI возглавит профессор Александр Горбань. Он является одним из ведущих российских и мировых специалистов в области теории динамических систем, математической химии и физики. Недавно профессор принял решение вернуться в Россию и возглавить работу в новой лаборатории.

Профессор занимался наукой в ведущих математических центрах США, Великобритании и других стран, более 30 его учеников получили научную степень. "После стольких лет работы за границей приятно видеть, как модифицируется система российского образования - становится прогрессивнее и практикоориентированнее. После выпуска из учебного заведения студент должен понимать, где может применить свои знания. Позиция Центрального университета в этом плане очень верная, на мой взгляд - начиная от осознанного выбора своей профессии и заканчивая стажировками в компаниях-партнерах", - отметил Горбань.

Лаборатория сфокусируется на фундаментальных исследованиях в области ИИ для развития и внедрения новых алгоритмов в бизнес. Еще одной из ключевых задач лаборатории станет воспитание плеяды ученых нового поколения.

Подписаться на Нейроскептик
Forwarded from Банкста
Доносчика из числа сотрудников OpenAI (ChatGPT) нашли мёртвым в своей квартире.  У него были доказательства незаконных действий компании.

Сухир Баладжи умер через три месяца после того, как публично обвинил OpenAI в нарушении закона об авторских правах. В компании он помогал тренировать ChatGPT, его заявление спровоцировало поток исков против OpenAI со стороны писателей, программистов и журналистов. Они утверждают, что ИТ-гигант незаконно обучал нейронку на их работах. Адвокаты говорили, что у Баладжи были уникальные  доказательства. @banksta
This media is not supported in your browser
VIEW IN TELEGRAM
Совсем недавно производитель технологии для беспилотных автомобилей Waymo запустил роботакси по всей территории Сан-Франциско. По данным компании, с момента запуска теста на поездки с Waymo подписалось около 300 000 человек — это более четверти населения города.

Также в компании утверждают, что в области безопасной эксплуатации беспилотное такси не имеет себе равных. Из более чем 30 научных работ следует, что Waymo Driver (WD) повышает безопасность дорожного движения в городах присутствия. ИИ-водитель избегает серьезных столкновений лучше, чем даже самые внимательные водители-люди, и данные показывают, что у WD меньше страховых претензий, травм или полицейских отчетов, чем у водителей-людей.

Однако, уже не мало случаев как роботакси Waymo откровенно тупит: нарезает круги вокруг одной точки (пассажиров в машине не было), выезжает на встречку, но самый ужасный инцидент произошел, когда WD сбил велосипедиста.

В общем, что-то не клеится с беспилотными автомобилями в США. До этого Департамент транспорта Калифорнии приостановил работу роботакси Cruise (конкурент Waymo), после нескольких крупных аварий.

Подписаться на Нейроскептик
В систему аналитики и атрибуции для мобильных приложений и сайтов MyTracker внедрили ИИ-ассистента. Теперь пользователям станет проще получать отчеты и не тратить время на настройку мультиплатформенный системы.

По запросу пользователя ИИ-агент соберет статистику, расскажет про аудиторию проекта и упростит аналитику, предоставив все необходимые отчёты в одном окне (рекламная активность, профиль, поведение пользователей, финансовые показатели и др.).

ИИ-ассистенты на базе LLM становятся всё более востребованы, разгружая специалистов, снимая с них рутину

Подписаться на Нейроскептик