Vojtěch Tóth

Vojtěch Tóth https://vojtechtoth.github.io Last 10 notes on Vojtěch Tóth Quartz -- quartz.jzhao.xyz Reinforcement Learning, An Introduction - exercises from chapter 2 https://vojtechtoth.github.io/Blog/Posts/Reinforcement-Learning,-An-Introduction---exercises-from-chapter-2 https://vojtechtoth.github.io/Blog/Posts/Reinforcement-Learning,-An-Introduction---exercises-from-chapter-2 Sun, 22 Feb 2026 23:14:42 GMT Upper-Confidence-Bound Action Selection https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Upper-Confidence-Bound-Action-Selection https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Upper-Confidence-Bound-Action-Selection Fri, 20 Feb 2026 21:40:08 GMT Multi-arm Bandits https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Multi-arm-Bandits https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Multi-arm-Bandits Fri, 20 Feb 2026 19:19:16 GMT Gradient bandits https://vojtechtoth.github.io/Vault/Gradient-bandits https://vojtechtoth.github.io/Vault/Gradient-bandits Fri, 20 Feb 2026 18:51:34 GMT Action-Value Methods https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Action-Value-Methods https://vojtechtoth.github.io/Vault/Symbolic-machine-learning/Reinforcement-learning/Bandits/Action-Value-Methods Fri, 20 Feb 2026 18:26:26 GMT Homework for next class https://vojtechtoth.github.io/Vault/Algorithm-theory/Exercices/Homework-for-next-class https://vojtechtoth.github.io/Vault/Algorithm-theory/Exercices/Homework-for-next-class Wed, 18 Feb 2026 16:32:58 GMT Robbins-Monro theorem https://vojtechtoth.github.io/Vault/NonFEL/Stochastic-approximation/Robbins-Monro-theorem https://vojtechtoth.github.io/Vault/NonFEL/Stochastic-approximation/Robbins-Monro-theorem Wed, 18 Feb 2026 11:15:59 GMT Root finding problem https://vojtechtoth.github.io/Vault/NonFEL/Stochastic-approximation/Root-finding-problem https://vojtechtoth.github.io/Vault/NonFEL/Stochastic-approximation/Root-finding-problem Wed, 18 Feb 2026 11:12:06 GMT Sharding https://vojtechtoth.github.io/Vault/Databases/Sharding https://vojtechtoth.github.io/Vault/Databases/Sharding Tue, 17 Feb 2026 21:44:43 GMT Markov's Inequality https://vojtechtoth.github.io/Vault/Statistics/Markov's-Inequality https://vojtechtoth.github.io/Vault/Statistics/Markov's-Inequality Tue, 17 Feb 2026 21:43:48 GMT