Нейроканал
9.27K subscribers
363 photos
143 videos
7 files
1.19K links
Искусственный интеллект, нейросети, машинное обучение

Разместить рекламу: @tproger_sales_bot

Правила общения: https://tprg.ru/rules

Другие каналы: @tproger_channels

Сайт: https://tprg.ru/site

Другие наши проекты: https://tprg.ru/media
Download Telegram
Давно у нас интервью не было

Интервью с известным нам специалистом по ИИ Янником Килчером. Мотивация идти в DS, разговоры о технических деталях, о рисках ИИ, как понять GPT-4, чем отличается искусственный интеллект от нашего и много ещё чего интересного.

Посмотреть:
https://www.youtube.com/watch?v=vDaNfQeh0jc

#позалипать
👍4
Мы движемся к созданию идеальных игр для социопатов

Плагин для Unreal Engine 5.2 под названием Replica позволяет вводить в игру NPC, способных на диалог а-ля ChatGPT. Так вот полюбуйтесь, как на протяжении 25 минут игрок просто ходит и доводит до истерики и кибербуллит (буквально) совершенно ни в чём неповинных NPC.

Посмотреть:
https://www.youtube.com/watch?v=ImaTImQi5ts

#позалипать
👍8
Пора узнать о тех, кто стоит за ChatGPT

Встречайте Сэма Олтмена, CEO OpenAI (и Лекса Фридмана, который берёт у него интервью). Всего понемногу, но конечно же главная тема интервью это ИИ. Политическая ангажированность нейросетей, настолько ли важен размер, безопасность и ещё другие темы по мелочи (например Илон Маск, прессинг компании со стороны государства и смысл жизни).

Посмотреть:
https://www.youtube.com/watch?v=L_Guz73e6fw

#позалипать
👍6💩1
Один Stable Diffusion XL и диетическую колу, пожалуйста

Очередной раз держим вас в курсе того, как улучшаются генеративные модели вида text-to-image. Сгенерированное изображение теперь больше, не надо расписывать промпт в деталях, как это было раньше, отрисовка рук тоже стала лучше (но всё ещё не идеальная) и в случае, если вы указываете конкретный стиль отрисовки (например художника), то он будет заметен сильнее.

Посмотреть:
https://www.youtube.com/watch?v=kkYaikeLJdc

Попробовать (3 попытки в день, дальше нужен аккаунт):
https://clipdrop.co/stable-diffusion

#позалипать
👍411
Продолжаем разговор про вероятных нетраннеров

А точнее, про хакеров и мошенников, использующих в своих черных делах ChatGPT. Сопровождать нас в этом разговоре будут Янник Килчер и специалист по кибербезопасности из Check Point Сергей Шукевич. Акцент Сергея слегка сложен к восприятию, но вы справитесь.

Посмотреть:
https://www.youtube.com/watch?v=10nEx2-8J0M

#позалипать
👍41
Поговорим возможностях в отрасли ИИ

А точнее, послушаем о трендах, возможностях, рисках и что нужно для стартапа в нашей любимой отрасли. А слушать мы будем знаменитого Эндрю Ына. Даже небольшой отрывок про ИИ-утилиту, помогающую развивать навыки в общении с противоположным полом.

Посмотреть:
https://www.youtube.com/watch?v=5p248yoa3oE

#позалипать
👍2
Иногда нам нужна оборона от непрошенных гостей в комнате

Допустим у вас совещание на работе или (для тех кто помладше) к родителям пришли гости, а их детей отправили к вам в комнату. Поэтому берёте, подключаете камеру на подвижном контролируемом сервомоторе к плате Ардуино через ПК (где работает модель детекции лица), которая контролирует наведение камеры на лицо, а к самой камере прикручиваете игрушечный NERF-пистолет с автоспуском, воткнутым в ту же Ардуино. Тот кто зайдёт в комнату сразу поймёт, что ему тут не рады. Берегитесь дружественного огня или носите скрывающую лицо маску.

Посмотреть:
https://www.youtube.com/watch?v=N5vzpi4yF7A

#позалипать
👍3💩1
Сегодня нас ждёт 3.5, но не ChatGPT

Недавно NVIDIA анонсировала DLSS 3.5 с трассировкой лучей, улучшенной с помощью нейросети. Раньше, при включении трассировки, из-за дискретной природы лучей и вычислений в ПК, мы не могли получить полное покрытие поверхности светом, из-за чего приходилось использовать алгоритмы шумоподавления, которые местами мылили картинку. Поэтому инженеры из NVIDIA использовали стандартное «пусть это делает нейросеть, она умнее» и делегировали шумоподавление новому этапу DLSS с нейросетью. Не то чтобы сейчас было много игр, которые поддерживают DLSS 3.5, но результат по картинке и по увеличению FPS можете пронаблюдать в этом видео.

Посмотреть:
https://www.youtube.com/watch?v=hr85Lc_WT38

#позалипать
👍2
Сиквел, который наверное кто-то ждал

DALL-E 3 был недавно анонсирован. В представлениях эта text-to-image модель не нуждается, но из анонса авторы обещают интеграцию с ChatGPT и различные улучшения, по сравнению со всеми существующими генеративными моделями. А ещё можно будет из картинок стикеры делать, воооот. Статьи или API пока не появилось, будем продолжать наблюдать. Надеемся, что эта третья часть будет лучше, чем Шрек 3.

Посмотреть:
https://www.youtube.com/watch?v=BAfOGBojiEU

Анонс:
https://openai.com/dall-e-3

#позалипать
👍3😁2
Очередные улучшения завезли в ChatGPT

А именно зрение, слух и голос. Теперь в запросах можно использовать картинки, звуковые файлы и запрашивать озвучку (например попросить написать детскую книжку, нарисовать к ней картинки и озвучить это всё). А ещё его можно послать прочитать инструкцию к вещи, в которой вы не можете разобраться, после чего он вам понятным языком расскажет, как собрать этот шкаф из ИКЕА. В случае с отечественной мебелью, собирают только сильнейшие, инструкции у вас не будет.

Посмотреть:
https://www.youtube.com/watch?v=k2bynqQ6el4

#позалипать
👍2
Если вы устали от реальности — отсканируйте её и уставайте от неё уже в виртуальности

NVIDIA выпустила свой Neuralangelo AI, который позволяет отсканировать своё окружение и получить высокодетализированную реконструкцию в 3D окружении. И видимо, чтобы мы не скучали, в это же время вышел Magic Avatar — text-to-motion-to-video утилита, где сначала можно задать общий вид движения какой-нибудь фигуры, а потом, поверх этого движения решать, будет это какой-нибудь робот-гуманоид или аниме-девочка. А может и аниме-девочка-робот-гуманоид, используйте фантазию.

Посмотреть (Neuralangelo AI):
https://www.youtube.com/watch?v=bSHz0NexLBU

Почитать (Neuralangelo AI):
https://research.nvidia.com/labs/dir/neuralangelo/

Репозиторий (Magic Avatar):
https://magic-avatar.github.io/

#позалипать
👍5
Как говорится, дообучение моделей — свет, а неученье — тьма

Как вы уже догадались, сегодня мы обсудим тему дообучения, и данное видео поможет более глубоко погрузиться в этот вопрос.

В ролике автор демонстрирует процесс файн-тюнинга модели BART для решения задачи суммаризации текста. Главная цель — познакомить зрителей с популярными библиотеками в области обработки естественного языка (NLP) и показать, как это можно делать максимально эффективно, затрачивая минимум усилий при написании кода.

#позалипать #nlp #дообучение
👍32
This media is not supported in your browser
VIEW IN TELEGRAM
Врываемся в 2024 со скоростью 100 котят в секунду

А если серьёзно, не так давно вышла новая версия Stable Diffusion под названием "Stable Diffusion XL Turbo". Эта версия создаёт изображения высокого качества со скоростью 100 картинок в секунду!

А в основе таких результатов лежит новый подход для генерации изображений — Adversarial Diffusion Distillation (ADD), который позволил сократить шаги генерации с 20-50 до 1-4 без потери качества.

Попробовать | Hugging Face | Видеообзор | Статья об ADD

#stablediffusion #позалипать #add
❤‍🔥112🤩1🎅1
Mamba: революционная архитектура или просто хайп?

Кто не в курсе Mamba — это потенциальный конкурент Transformer. Эта архитектура масштабируется линейно с ростом длины входной последовательности, эффективно использует память и показывает отличные результаты на задачах с длинным контекстом.

В новом видео Янник Килчер разобрал отличия Mamba от Трансформеров и RNN и показал какие преимущества и ограничения есть у этой архитектуры.

Статья | GitHub | Hugging Face

#mamba #transformer #позалипать
👍62🔥1
Пишем своего бота с Уолл-стрит

А если быть точнее, полностью автоматизированного торгового бота на базе искусственного интеллекта. Используя торговую платформу Lumot и модель FinBERT для анализа финансовых новостей, этот бот самостоятельно сможет выявлять тренды и принимать решения о покупке или продаже активов.

Посмотреть | Код из видео

#гайд #позалипать #программирование
😱32👍1
Лучшие модели обнаружения объектов

В этом видео автор подготовил подробный обзор моделей для распознавания объектов, таких как YOLOv8, YOLOv7, RTMDet, DETA и GroundingDINO. Он тщательно проанализировал их, оценивая по ключевым критериям: точность, поддержка сообщества, наличие удобной документации и открытых лицензий.

Помимо этого, в видео есть практические рекомендации по выбору оптимальной модели в зависимости от конкретных задач, которые предстоит решать.

#cv #позалипать
👍112🆒2
This media is not supported in your browser
VIEW IN TELEGRAM
Неожиданно для всех Билл Гейтс выпустил подкаст с Сэмом Альтманом. Интервью получилось небольшим, но весьма содержательным. 

Они затронули актуальные темы дальнейшего развития ChatGPT, включая приобретение им мультимодальности и персонализации под конкретного пользователя. Также обсудили горячую тему появления AGI и идею создания глобального регулирующего органа для мощных ИИ систем.

Напоследок интересный факт: Билл признался, что изначально он сомневался в том, что ChatGPT окажется настолько выдающимся.

Смотреть | Перевод интервью

#позалипать #подкаст
👍101🔥1
Любители комиксов и Data Science на месте?

Нашли уникальный в своём роде ресурс с обучающими материалами на тему Data Science от Allison Horst.

На сайте представлена комиксы о статистике, линейной регрессии, библиотекам и прочим прелестям, которые сопровождаются крутой графикой.

Вот если бы статьи с arXiv выглядели бы также

#позалипать
7😁4👍2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Text-to-image — было, Text-to-video тоже. А как насчёт Speech-to-Speech
 
Энтузиаст с ютуба сделал Speech-to-Speech систему, с которой можно лампово поболтать холодным зимним вечером под чашечку чая, ну или не совсем лампово. Потому как всё зависит от промпта, который вы дадите своему виртуальному собеседнику. В случае автора — это Джули (девушка хакер из даркнета) и Джони — (сумасшедший исследователь искусственного интеллекта).
 
Всё это дело работает локально и на удивление имеет довольно низкую задержку. Для распознавания речи применяется Whisper от OpenAI. Затем текст обрабатывается моделью Mistral 7B в LM Studio для генерации ответа, который в итоге озвучивается с помощью библиотеки Open Voice.

#позалипать #project #python
👍173🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Google снова облажался?

Для тех, кто не в курсе: недавно Google выпустила про версию Gemini 1.5 с мультимодальностью и впечатляющей длиной контекста в 1 миллион токенов. Туда буквально можно загрузить примерно часовое видео, 11 часов аудио, более 30 тысяч строк кода и до 700 тысяч строк текста. И в этой области нейросеть справляется действительно хорошо.

Но как обстоят дела с генерацией изображений? Пользователи быстро обнаружили, что Gemini отказывается генерить белых людей и их достижения, но без проблем создаёт изображения темнокожих, азиатов и индейцев. Янник сделал видео по этому поводу, смотрите, это точно скрасит ваш понедельник!

#gemini #позалипать #нейроновости
😁11🤣83🦄2👍1