gptscience πŸ€–
206 subscribers
42 photos
28 videos
50 links
Π‘Π²Π΅ΠΆΠΈΠ΅ новости ΠΈΠ· ΠΌΠΈΡ€Π° GPT-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Машинного ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΡ ΠΈ Π˜Π˜πŸ€–

Для связи: @sokoloveai
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
#GPTApplication LIV: Языковая Ρ†Π΅Π½Π½ΠΎΡΡ‚ΡŒ изобраТСния для Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ² πŸ€–

πŸ€“ Π’ ΡΡ‚Π°Ρ‚ΡŒΠ΅ Language-Image Value Learning прСдставлСн Π½ΠΎΠ²Ρ‹ΠΉ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сочСтаСт Π² сСбС reinforcement learning ΠΈ mutual information constractive learning для обучСния Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ² Π·Ρ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ-языковому ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΡŽ с использованиСм систСмы Π²ΠΎΠ·Π½Π°Π³Ρ€Π°ΠΆΠ΄Π΅Π½ΠΈΠΉ.

ΠžΡΠ½ΠΎΠ²Π½Ρ‹Π΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹ ΠΈΠ· ΡΡ‚Π°Ρ‚ΡŒΠΈ:

πŸ—‚ МоТно ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ большиС Π½Π°Π±ΠΎΡ€Ρ‹ Π²ΠΈΠ΄Π΅ΠΎΠ΄Π°Π½Π½Ρ‹Ρ… для обучСния ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Π—Π°Ρ‚Π΅ΠΌ модСль ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠΆΠ΅Ρ‚ Π½Π°Π·Π½Π°Ρ‡Π°Ρ‚ΡŒ вознаграТдСния (ΠΏΠΎΠΎΡ‰Ρ€Π΅Π½ΠΈΠ΅ Π·Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ дСйствия ΠΌΠΎΠ΄Π΅Π»ΠΈ) ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΌ ΠΊΠ°Π΄Ρ€Π°ΠΌ Π² Π²ΠΈΠ΄Π΅ΠΎ, Π³Π΄Π΅ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ прСдставлСны Ρ€ΠΎΠ±ΠΎΡ‚Ρ‹ ΠΈΠ»ΠΈ люди, Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡŽΡ‰ΠΈΠ΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹Π΅ Π·Π°Π΄Π°Ρ‡ΠΈ Π² Π½ΠΎΠ²Ρ‹Ρ… условиях.

🧠 LIV ΠΌΠΎΠΆΠ½ΠΎ Π·Π°Ρ„Π°ΠΉΠ½Ρ‚ΡŽΠ½ΠΈΡ‚ΡŒ Π·Π° счСт Ρ‚ΠΎΡ‡Π½ΠΎΠΉ настройки с использованиСм Π΄Π°Π½Π½Ρ‹Ρ…, спСцифичных для ΠΏΡ€Π΅Π΄ΠΌΠ΅Ρ‚Π½ΠΎΠΉ области, Ρ‡Ρ‚ΠΎ ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΡ‚ Π»ΡƒΡ‡ΡˆΠ΅ ΡƒΠΏΡ€Π°Π²Π»ΡΡ‚ΡŒ Ρ€ΠΎΠ±ΠΎΡ‚Π°ΠΌΠΈ.

πŸ‘¨β€πŸ’» К ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρƒ, Ρ€ΠΎΠ±ΠΎΡ‚Π° ΠΈΠ· Π²ΠΈΠ΄Π΅ΠΎ, готовящСго сочный πŸ”, Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²Π°Π»ΠΈ Π½Π° датасСтС EpicKitchen

ΠœΡ‹ ΡƒΠΆΠ΅ рассматривали Tennis AI ΠΊΠ°ΠΊ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ обучСния ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° спСцифичСских Π΄Π°Π½Π½Ρ‹Ρ…, Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ доступно Π½Π° Ρ€ΠΎΠ±ΠΎΡ‚Π°Ρ… πŸ€–
Please open Telegram to view this post
VIEW IN TELEGRAM
❀2πŸ‘2πŸ”₯2
#GPTEli5 ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ² πŸ€–

🧠 Language-Image Value learning (LIV) - ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сочСтаСт Π² сСбС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ ΠΈ контрастным ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ для ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚ ΠΊΠ°ΠΊ язык, Ρ‚Π°ΠΊ ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎΠ± ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ / Π²ΠΈΠ΄Π΅ΠΎ для Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ².

πŸ€“ Mutual Information Contrasive Learning (контрастноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅) - ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ модСль Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… источников (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, языка ΠΈ изобраТСния) ΠΏΡƒΡ‚Π΅ΠΌ максимизации Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ.

πŸ‘¨β€πŸ’» Reinforcment learning (ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ) - ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π° основС ΠΏΡ€ΠΎΠ± ΠΈ ошибок, Π³Π΄Π΅ ΠΎΠ½Π° ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ вознаграТдСния Π·Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ дСйствия.
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ‘4❀2πŸ”₯2