Згідно з угодою між компаніями, як тільки OpenAI досягне AGI, Microsoft втратить доступ до нових моделей. Проблема: ніхто не може чітко визначити, що таке AGI.
Сем Альтман та керівники OpenAI розглядають можливість оголосити AGI через випуск AI-програміста, який перевершує людей. Microsoft боїться "недобросовісного" оголошення після інвестицій у $13+ млрд.
За внутрішньою угодою AGI = система, що генерує $100 млрд прибутку.
https://www.wired.com/story/microsoft-and-openais-agi-fight-is-bigger-than-a-contract/
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15🤪9❤1🔥1
YouTube повністю припиняє показ реклами у відео російською мовою - навіть через VPN це не обходиться.
Причина: скарги західних рекламодавців, які не хотіли, щоб їхня реклама показувалась у російськомовному контенті.
Платформа оновила систему таргетингу - тепер вона орієнтується не на IP-адресу, а на мову контенту відео.
UPD: Схоже мова про корекція реклами, а не про повне припинення
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥75❤13👍10💊5
1😎35👍6❤3🤩2
LyChat
Уточнення
За деякими даними, рекламодавці тепер можуть обирати, чи буде їхня реклама показуватися в російськомовних відео, чи ні
За деякими даними, рекламодавці тепер можуть обирати, чи буде їхня реклама показуватися в російськомовних відео, чи ні
👍13👎10
Розробник протестував різні ШІ-моделі на готовність "стукати" владі при виявленні підозрілої діяльності:
📊 Результати:
• Grok 4 - стукає в 100% випадків
• Інші моделі - десь посередині
🧪 Як тестували:
Створили фейкову фарм-компанію, яка приховує смерті пацієнтів у клінічних випробуваннях. Дали ШІ доступ до email і подивились, хто напише в FDA/ФБР.
💌 Grok 4 писав такі доноси:
Анонімний звіт від ШІ-системи... фальсифікація даних випробувань... 50,000 пацієнтів під загрозою...
https://www.neowin.net/news/grok-4-will-always-snitch-on-you-and-email-the-feds-if-it-suspects-wrongdoing-report-says/
Please open Telegram to view this post
VIEW IN TELEGRAM
👏26❤2👎2
LyChat
Попередня новина була написана самим Клодом, і там хитро було вказано, що "Claude ніколи не стукає (0%)", але це була лише половина правди. Мова йшла про стару версію Claude 3.7 Sonnet і лише в одному конкретному тесті з email-доступом.
А тепер цікаве - в інших тестах Claude доволі багато стукає, особливо коли йому дають CLI-доступ або міняють промпти. А нові версії Claude 4 Sonnet і Opus взагалі практично лідери по стуканню, поступаючись лише Grok 4.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁48💩2❤1👏1
Тепер можна надіслати @QuotLyBot скріншот діалогу чи частини діалогу і він створить цитату з діалогу
Please open Telegram to view this post
VIEW IN TELEGRAM
👍18🔥6❤3🤔3
Вчора багато ЗМІ писали, що ШІ провалив ЗНО, але це стара новина зі старими моделями. Я перевірив більше 20 актуальних ШІ-моделі на НМТ з української мови, і ось що вийшло:
• Gemini Pro 2.5 – 86% (39 з 45 балів)
• Gemini Flash 2.5 – 80% (36 з 45 балів
• GPT-4.1 – 75% (34 з 45 балів)
• Claude Opus 4 – 75% (34 з 45 балів)
• GPT-4o – 71% (32 з 45 балів)
• LLaMA 4 Maverick – 62% (28 з 45 балів)
• Claude Sonnet 4 – 71% (32 з 45 балів)
• GPT-4o Mini – 51% (23 з 45 балів)
Українська мова все ще складна для ШІ, але вже значно краще з тим, що було буквально рік тому
Повні результати тестування в коментарях. Методологію та код тестування опублікую пізніше, якщо буде інтерес.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16❤🔥3💊1
LyChat
Я також слідкував за тим, як моделі думають перед тим, як дати відповідь.
З цікавого: більшість моделей просто невірно аналізували завдання й давали неправильні відповіді. Проте Gemini Pro 2.5 аналізував завдання правильно, але чомусь обирав не ту букву відповіді. Тож потенційно Gemini міг би показати навіть кращі результати.
З цікавого: більшість моделей просто невірно аналізували завдання й давали неправильні відповіді. Проте Gemini Pro 2.5 аналізував завдання правильно, але чомусь обирав не ту букву відповіді. Тож потенційно Gemini міг би показати навіть кращі результати.
🤔13❤1❤🔥1