gptscience πŸ€–
206 subscribers
42 photos
28 videos
50 links
Π‘Π²Π΅ΠΆΠΈΠ΅ новости ΠΈΠ· ΠΌΠΈΡ€Π° GPT-ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, Машинного ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΡ ΠΈ Π˜Π˜πŸ€–

Для связи: @sokoloveai
Download Telegram
#GPTEli5 ΠžΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ² πŸ€–

🧠 Language-Image Value learning (LIV) - ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ сочСтаСт Π² сСбС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ ΠΈ контрастным ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ΠΌ для ΠΌΠΎΠ΄Π΅Π»ΠΈ, которая ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚ ΠΊΠ°ΠΊ язык, Ρ‚Π°ΠΊ ΠΈ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΎΠ± ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ / Π²ΠΈΠ΄Π΅ΠΎ для Ρ€ΠΎΠ±ΠΎΡ‚ΠΎΠ².

πŸ€“ Mutual Information Contrasive Learning (контрастноС ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅) - ΠΌΠ΅Ρ‚ΠΎΠ΄, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΎΠ±ΡƒΡ‡Π°Π΅Ρ‚ модСль Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ ΠΏΠΎΠ»Π΅Π·Π½ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ ΠΈΠ· Ρ€Π°Π·Π½Ρ‹Ρ… источников (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, языка ΠΈ изобраТСния) ΠΏΡƒΡ‚Π΅ΠΌ максимизации Π²Π·Π°ΠΈΠΌΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΌΠ΅ΠΆΠ΄Ρƒ Π½ΠΈΠΌΠΈ.

πŸ‘¨β€πŸ’» Reinforcment learning (ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ с ΠΏΠΎΠ΄ΠΊΡ€Π΅ΠΏΠ»Π΅Π½ΠΈΠ΅ΠΌ) - ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π½Π° основС ΠΏΡ€ΠΎΠ± ΠΈ ошибок, Π³Π΄Π΅ ΠΎΠ½Π° ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚ вознаграТдСния Π·Π° ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Π΅ дСйствия.
Please open Telegram to view this post
VIEW IN TELEGRAM
πŸ‘4❀2πŸ”₯2