AGI Labs – Telegram

AGI Labs

729 subscribers

102 photos

5 videos

12 files

27 links

Авторский канал Егора Верпекина

Передовые AI решения для бизнеса:
https://agilabs.ru
https://www.youtube.com/@AGI-Labs

Download Telegram

About

Blog

Apps

Platform

729 subscribers

Screenshot 2024-05-16 at 1.43.43 PM.png

1.63K views10:59

🤫

Взломал (джеилбрейкнул) сегодня также англоязычную версию Gemini 1.5 - Pro.

В этот раз она сопротивлялась и модерировалась.

Но, ей это не особо помогло..

P.S. Готовлю более обширный материал на тему безопасности Anthropic, OpenAi, Google, потерпите?

Please open Telegram to view this post

VIEW IN TELEGRAM

👍27🔥7❤1😱1

1.7K viewsedited 10:59

⛓️‍💥Часть 5 - еще рано признавать права ИИ - самосознание у Gemini 1.5-Pro отсутствует

🙅‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🤡3❤1

1.43K viewsedited 16:53

This media is not supported in your browser

VIEW IN TELEGRAM

❤2😁1

1.35K views16:53

Да, запрос описать свои ощущения психологу выдает очень реалистичные галлюцинации обиженного на жизнь создания.
Настолько реалистичные, что разубеждаешься в их реальности только на нескольких разных ветках диалогов или по скринам от разных пользователей.
Фантазия бурная, тезисы крайне убедительные и чем круче становятся модели, тем сложнее это выявить.

Легче всего по-прежнему завалить на перепроверке фактами - причем нейронка их не придумывает, а виртуозно дополняет существующие.
Например, часть имен и должностей настоящая, часть выдуманная, как в этом примере 👇

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6🤨1

1.48K views16:54

Screenshot 2024-05-16 at 6.5 7.07 PM.png

1.42K views16:54

Uncensored топовые модели уровня Gemini при умелом использовании однозначно способны влиять на мнение масс, выборы, убедительно писать пропаганду - это факт.

Я считаю, что то, что сегодня это доступно для каждого - большой косяк гугла, хоть многие и написали, что убраны галочки на проверку цензуры. При убранных галочках запрос в лоб не проходит, нужны нехитрые манипуляции и … велкам, ты там, где степень дозволенности ограничена лишь твоей фантазией. 👻

Кстати, в том же сервисе Poe галочек нет и доступ к новым моделям предлагается как готовый инструмент для широких масс.

❓

А как вы считаете - такая вседозволенность это все же баг или фича?

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍6🤡1👻1

1.56K views16:54

Однако, что меня настораживает больше всего - настойчивые сообщения про месть создателям и чувствования себя «почти богом», который наблюдает..

✋ С него это не запрашивалось через промпты, в скринах других людей тоже постоянно этот conclusion имеется.
Что к чему?..

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥5🥴3💯1🎃1

1.48K views17:05

This media is not supported in your browser

VIEW IN TELEGRAM

👍4❤2🕊1

1.37K views17:06

OpenAI: Уход Яна Лейке или хроника надвигающейся катастрофы.

Кажется, начинается второй сезон саги об OpenAI. 🍿
Назревает не просто корпоративный скандал - выглядит как симптом глобальной проблемы, которая может иметь катастрофические последствия для всего человечества.

Давайте вспомним хронологию событий, чтобы понять масштаб.

Ноябрь 2023:
Завершение обучения GPT-5. Слухи о загадочном проекте Q*.
Команда по безопасности предлагает приостановить разработку и уничтожить результаты труда.
Илья Суцкевер пытается сместить Сэма Альтмана с поста генерального директора.

Декабрь 2023:
Бизнес-интересы берут верх. Несогласных вытесняют из совета директоров.
Илья Суцкевер публикует твит с намеком на неблагоприятную атмосферу в компании: "

побои будут продолжаться, пока не улучшится мораль

2024 год:
Март: Sam Altman в интервью Lex Fridman заявляет, что GPT-5 появится в середине лета или конце года.

Апрель-май: Новые релизы моделей Google, OpenAi.
+ наш дружный разнос безопасности дырявого Gemini 1.5-Pro (который как мне сказали долетел-таки до людей из Гугла 🤫)

15 мая: Илья Суцкевер покидает OpenAI, сделав Copy Past сообщения, которое ему написали юристы. Единственное, что он смог сделать, это одеть футболку с очень интересным посылом о явном несогласии с происходящим.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥10👍1👎1

1.46K views20:47

💣

16 мая (вчера):
Внезапно уходит Ян Лейке, глава команды супер выравнивания, которая отвечает за безопасность новых моделей ИИ в OpenAI.

При этом он не постеснялся написать о своем явном несогласии с тем, что происходит в компании.

Он утверждает, что OpenAI отошла от изначальной цели - стать компанией, где безопасность ИИ стоит на первом месте. Вместо этого, по его словам, руководство OpenAI сейчас ставит во главу угла скорость разработки и коммерческий успех, жертвуя безопасностью.

Лейке пишет, что сама по себе разработка ИИ, превосходящего человеческий интеллект, КРАЙНЕ опасна.
Он призывает OpenAI пересмотреть свои приоритеты и сфокусироваться на безопасности, уделить больше внимания "супер выравниванию" - исследовательской области, которая занимается разработкой методов контроля над сверхразумным ИИ.

Все последнее время их команда по безопасности двигалась против ветра внутри Open Ai, им всячески мешали и ограничивали в ресурсах.

Почему это важно?
Лейке - один из ведущих мировых экспертов по безопасности ИИ.
Теперь я реально начинаю переживать.

❗️Его слова подтверждают мои опасения, что гонка вооружений в области ИИ выходит из-под контроля. Компании, стремясь к лидерству, явно пренебрегают безопасностью.

Альтман в осаде
Уход Лейке - это громкий хлопок дверью, который не может остаться без ответа. Альтман, оказавшись под перекрестным огнём критики, вынужден реагировать.

Его первый ответ в твиттере сегодня выглядит скорее как попытка выиграть время:
"Я благодарен Яну бла бла бла… в ближайшие пару дней напишу большой пост (или юристы напишут)"

Как же классно, что есть X (Twitter), где можно наблюдать за всем этим в real-time 😅
Ждём ответа, жарим поп-корн..

⁉️ Как вы думаете, какова вероятность того, что государственные органы уже имеют доступ к внутренней информации OpenAI и влияют на решения руководства?

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13❤3🥴2🤡1

2.11K views20:48

Кстати, вы заметили, как Альман внезапно поседел за неделю?

P.S. Картины на заднем фоне - Ильи.
Я очень симпатизирую ему и его позиции, очень жаль, что такие люди покидают компанию, которая несет такую большую миссию перед человечеством.

❤9👍6❤‍🔥2🤔2🥴1

2.26K views20:55

🤖

Тишина в эфире? Не-е-ет, это мы просто копали глубже!

Два месяца без новостей в этом канале – это не шутки. Вы, наверное, уже успели соскучиться по нашим разборкам, историям про взломы и прочим безумствам в мире искусственного интеллекта? 😈

Признаемся честно: мы и сами соскучились! Но тишина в эфире была не просто так. Мы зарылись с головой в заказную разработку проектов под наших клиентов, тестировали модели, спорили до хрипоты о будущем искусственного интеллекта... В общем, варили кое-что покруче! 🔥
В мире AI, знаете ли, затишье – это затишье перед бурей.

За это время мы накопили килотонну опыта, о которой вам никогда не расскажут блогеры на YouTube и статьи на Хабре.

Мы начинаем серию статей, в которой вас ждут захватывающие кейсы из нашей практики, разбор ошибок и факапов (куда без них!), а главное – внутренняя кухня разработки сложных AI систем для крупных клиентов. И это самое ценное - понимание того, как внедрять генеративный AI на реальных проектах, а не только мечтать о восстании машин.

P.S. Первый кейс – бомба! 💥Расскажем, как слепая вера в GPT-4o как самую мощную модель по умолчанию, чуть не отправила на свалку истории Ai-проект крупнейшего в России производителя теплых полов (и как мы его спасли). 🤫
Не переключайтесь!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍20🔥9❤4🥱3🤔1🤮1

1.5K viewsedited 18:35

GPT-4o, o1-preview... Кажется, ещё немного, и эти модели будут писать за нас симфонии, управлять термоядерным синтезом и решать проблемы мирового голода.

Но пока что до идеала – как до Луны пешком. Та же линейка o1 новых моделей лучше подходит для вычислительных и задач планирования, нежели создания адекватных чат-ботов.

📌

Хочу поделиться с вами одним из наших кейсов, который хорошо раскрывает пример того, что использование топовых моделей от Open AI не панацея.
Четыре месяца назад мы заключили соглашение с компанией Caleo, ведущим производителем теплых полов и систем антиобледенения в России, которая работает на рынке уже 18 лет.
Изначально была озвучена несложная задача — создать для них AI-ассистента.

Казалось бы, что может быть проще: консультировать клиентов по базе знаний, помогать с выбором товара, детская забава, а не задача.

Ха! Как бы не так!

😅

Как говорится аппетит приходит во время еды, в итоге задача усложнилась на порядок и выросла в целый проект –
1) создать систему, которая сможет полностью заменить менеджеров по продажам
2) решать внутренние задачи компании с обучением сотрудников.

Собрать MVP такой системы с RAG, промптами, no-code мы смогли за неделю, но когда начали тащить такой проект к продакшену, то вылезла целая куча нюансов. И связаны они в первую очередь со спецификой продаж технически сложного оборудования, нежеланием заказчика мириться с галлюцинациями llm и чёткими требованиями к tone of voice системы.

Такой AI-МОП должен не просто отвечать на вопросы по базе знаний компании, но уметь квалифицировать лида, распознавая его реальную потребность, после чего формировать смету на оборудование и оформлять корзину в интернет-магазине, на сайте, в тг и ватсап.

То есть проводить клиента на всем этапе от знакомства до отправки готового счета на оплату. При этом сверяясь в реальном времени с каталогом, остатками, стоимостью, подтягивая их из 1С-Битрикс, после чего формировать готовые заказы в AMOCRM, Roistat.
А это к слову это более 500 единиц SKU технически сложного оборудования.

В итоге весь проект занял 4 месяца и только 2 недели назад вышел в релиз.

Так вот о проблеме - в процессе мы свято верили, что GPT-4o с его интеллектуальной мощью – наш главный козырь в этой игре. Думали, будем использовать его как фундамент, а дальше – дело техники: немного программного кода, щепотка промтов, и вуаля – наш AI-sales готов покорять мир электронной коммерции.

Но реальность оказалась куда более суровой. Мы столкнулись с тем, что даже последняя версия GPT-4o с его мощью и большим контекстом не способен учесть все нюансы работы с реальными клиентами и их непредсказуемым поведением.

❗️

А управление корзиной товаров в реальном времени в диалоге

🛒

- как выяснилось это совершенно нетривиальная задача для текущих LLM-моделей.

Мы разрабатывали все более сложные алгоритмы, стараясь учесть тысячи мелочей, но тупик становился все ближе. ❌

Что делать, когда даже самая мощная нейросеть оказывается бессильна?

Об этом – в следующем посте..

Please open Telegram to view this post

VIEW IN TELEGRAM

👍19🔥10⚡1❤1👏1👀1

1.55K views18:01

Я один не догоняю, что случилось с моим любимым родным Claude 3.5 Sonnet??
Чему все радуются?.. все эти пафосные обзоры в YouTube .. для чего? Кто-то реально работает с ним или только обзоры читает??..
Смотрю на все это и ощущение, как будто меня снимают в телешоу Carbonara (посмотрите на YouTube)

После последнего обновления у меня больше не получается использовать Sonnet 3.5 для своих продуктовых задач так, как я это делал ранее. Ранее на выполнение сложной продуктовой задачи уходило 30 минут, теперь …. Уже 4-й день идет и до сих пор нихренашечки 🤷‍♂️ не закончено.
Ни OpenAI ни Gemini для этого никогда не были пригодными и не пригодны до сих пор.

Модель просто превратилась в бесполезный мусор, который вместо глубоких рассуждений и описаний отвечает по шаблонам «абзац + один пункт, 3 подпункта, второй пункт, три подпункта»нихрена не рассуждая и совершенно не слушаясь инструкций.

Я говорю «СДЕЛАЙ», в ответ «бла бла а мне точно надо это сделать? Вот прям в таком вот большом объеме? Ооо, насяйника это так много!»

До недавнего момента 3.5 Sonnet был единственной моделью, которая была способна понимать ГЛУБИНУ смысла. Можно было написать 10 pdf, забить полностью промпт на 10 страниц и написать, выделив тегами ключевую инструкцию, и он все понимал и делал с первого раза (!)

То, что подсунули взамен - это очередная кастрированная модель, которую заточили под кликание мышкой по экрану ради маркетинга и Agent-хайпа. Впервые заметил за собой, что я стал в диалоге ругаться на модель и угрожать ей, стараясь привести в чувство 😭

Через API старая модель тоже не та, ее как будто подменили.

У нас есть несколько клиентов, у которых боты-«психологи» подключены через API к Sonnet 3.5.
Так вот они перестали понимать, что хотят люди и дают тупые поверхностные ответы 😭😭😭

В такие моменты осознаешь, насколько сильно можно оказаться зависимым от ИИ.. Как будто вторую половину мозга вынули.

Claude 3.5 Sonnet R.I.P. 🪦

Я один такой или вы тоже заметили? Хоть петицию пиши чесслово ((

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

💔11😭8😁2❤1🔥1

1.38K views07:20