Тут ребята применили обратный РЛ, чтобы узнать мотивации червей (не дождевых червей, а Caenorhabditis elegans). Ну то есть как обычно: награда -> стратегия, а тут посчитали что стратегия у этих червей и так оптимальная, поэтому интересно посмотреть что там за награды #reinforcementlearning
  подоспел свежий фреймворк для  #reinforcementlearning  от фейсбука, типа очень гибкий и быстрый, позволяет запускать среды пачками и проч. https://github.com/facebookresearch/ELF
  
  GitHub
  
  GitHub - facebookresearch/ELF: An End-To-End, Lightweight and Flexible Platform for Game Research
  An End-To-End, Lightweight and Flexible Platform for Game Research - facebookresearch/ELF