Richard Sutton și Andrew Barto câștigă Premiul Turing pentru progresele în învățarea prin recompensă Adriana Moscu | 06.03.2025