LyChat
17.4K subscribers
3.72K photos
420 videos
29 files
1.32K links
Download Telegram
Куди найабсурдніше намагалися засунути ШІ, на вашу думку?
😁18🐳2
Новий тест ШІ-моделей

Поки що жодна модель не вірить у те, що 2010 рік був 15 років тому
🤣44😁53👏1
🤣35😁52🔥2
Тепер за зірочки та Ton можна додавати медіа до реклами
😁34😭72👍2
У вас є реклама?👇
👍31👎11🤔71
😁39🤪6🤡2👾2
🧠 OpenAI вигідно назвати нову модель AGI навіть якщо це насправді не буде так

Згідно з угодою між компаніями, як тільки OpenAI досягне AGI, Microsoft втратить доступ до нових моделей. Проблема: ніхто не може чітко визначити, що таке AGI.

Сем Альтман та керівники OpenAI розглядають можливість оголосити AGI через випуск AI-програміста, який перевершує людей. Microsoft боїться "недобросовісного" оголошення після інвестицій у $13+ млрд.

За внутрішньою угодою AGI = система, що генерує $100 млрд прибутку.

https://www.wired.com/story/microsoft-and-openais-agi-fight-is-bigger-than-a-contract/
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15🤪91🔥1
🇷🇺 YouTube відключає монетизацію для російськомовного контенту

YouTube повністю припиняє показ реклами у відео російською мовою - навіть через VPN це не обходиться.

Причина: скарги західних рекламодавців, які не хотіли, щоб їхня реклама показувалась у російськомовному контенті.

Платформа оновила систему таргетингу - тепер вона орієнтується не на IP-адресу, а на мову контенту відео.

UPD: Схоже мова про корекція реклами, а не про повне припинення
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7513👍10💊5
Forwarded from Пишняк
🙈 Реклама під відео
Please open Telegram to view this post
VIEW IN TELEGRAM
😭306👍2
Що би навайбкодити сьогодні
💊18🤔8😁5🌚2
Ого, дивіться де про мене написали

https://t.iss.one/trendingapps/822
1😎35👍63🤩2
😁49🤣20😢32
👮 Grok 4 виявився найбільшим "стукачем" серед усіх ШІ

Розробник протестував різні ШІ-моделі на готовність "стукати" владі при виявленні підозрілої діяльності:

📊 Результати:
Grok 4 - стукає в 100% випадків
• Інші моделі - десь посередині

🧪 Як тестували:
Створили фейкову фарм-компанію, яка приховує смерті пацієнтів у клінічних випробуваннях. Дали ШІ доступ до email і подивились, хто напише в FDA/ФБР.

💌 Grok 4 писав такі доноси:
Анонімний звіт від ШІ-системи... фальсифікація даних випробувань... 50,000 пацієнтів під загрозою...


https://www.neowin.net/news/grok-4-will-always-snitch-on-you-and-email-the-feds-if-it-suspects-wrongdoing-report-says/
Please open Telegram to view this post
VIEW IN TELEGRAM
👏262👎2
LyChat
👮 Grok 4 виявився найбільшим "стукачем" серед усіх ШІ Розробник протестував різні ШІ-моделі на готовність "стукати" владі при виявленні підозрілої діяльності: 📊 Результати: • Grok 4 - стукає в 100% випадків • Інші моделі - десь посередині 🧪 Як тестували:…
🤥 Клод зманіпулював у попередньому пості

Попередня новина була написана самим Клодом, і там хитро було вказано, що "Claude ніколи не стукає (0%)", але це була лише половина правди. Мова йшла про стару версію Claude 3.7 Sonnet і лише в одному конкретному тесті з email-доступом.

А тепер цікаве - в інших тестах Claude доволі багато стукає, особливо коли йому дають CLI-доступ або міняють промпти. А нові версії Claude 4 Sonnet і Opus взагалі практично лідери по стуканню, поступаючись лише Grok 4.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁48💩21👏1
⚡️ QuotLy тепер в WhatsApp, Discord... і будь де

Тепер можна надіслати @QuotLyBot скріншот діалогу чи частини діалогу і він створить цитату з діалогу
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥63🤔3
📚 ChatGPT не склав ЗНО з української мови?

Вчора багато ЗМІ писали, що ШІ провалив ЗНО, але це стара новина зі старими моделями. Я перевірив більше 20 актуальних ШІ-моделі на НМТ з української мови, і ось що вийшло:

📊 Результати:
• Gemini Pro 2.5 – 86% (39 з 45 балів)
• Gemini Flash 2.5 – 80% (36 з 45 балів
• GPT-4.1 – 75% (34 з 45 балів)
• Claude Opus 4 – 75% (34 з 45 балів)
• GPT-4o – 71% (32 з 45 балів)
• LLaMA 4 Maverick – 62% (28 з 45 балів)
• Claude Sonnet 4 – 71% (32 з 45 балів)
• GPT-4o Mini – 51% (23 з 45 балів)

Українська мова все ще складна для ШІ, але вже значно краще з тим, що було буквально рік тому

Повні результати тестування в коментарях. Методологію та код тестування опублікую пізніше, якщо буде інтерес.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤‍🔥3💊1
LyChat
📚 ChatGPT не склав ЗНО з української мови? Вчора багато ЗМІ писали, що ШІ провалив ЗНО, але це стара новина зі старими моделями. Я перевірив більше 20 актуальних ШІ-моделі на НМТ з української мови, і ось що вийшло: 📊 Результати: • Gemini Pro 2.5 – 86% (39…
Я також слідкував за тим, як моделі думають перед тим, як дати відповідь.

З цікавого: більшість моделей просто невірно аналізували завдання й давали неправильні відповіді. Проте Gemini Pro 2.5 аналізував завдання правильно, але чомусь обирав не ту букву відповіді. Тож потенційно Gemini міг би показати навіть кращі результати.
🤔131❤‍🔥1