bandit-algorithm

Client that handles the administration of StreamingBandit online, or straight from your desktop. Setup and run streaming (contextual) bandit experiments in your browser.

react javascript client machine-learning webapp bandit-learning contextual-bandits multiarm-bandit bandit-algorithm streamingbandit-client

Updated Dec 7, 2022
JavaScript

NickKaparinos / Stanford-CS-234-RL-2022

Star

Solutions to the Stanford CS:234 Reinforcement Learning 2022 course assignments.

deep-reinforcement-learning stanford-university pytorch dqn bandit-algorithm policy-gradients

Updated Jun 27, 2022
Python

mgpopinjay / bandit-algorithms

Star

A small collection of Bandit Algorithms (ETC, E-Greedy, Elimination, UCB, Exp3, LinearUCB, and Thompson Sampling)

online-learning bandit-algorithm

Updated May 25, 2022
Python

vwang0 / causal_inference

Star

experiment simulation ab-testing bandit-learning bandit-algorithm

Updated Oct 28, 2020
Jupyter Notebook

simerplaha / reinforcement-learning

Sponsor

Star

Reinforcement learning

reinforcement-learning monte-carlo markov-decision-processes bellman-equation bandit-algorithm

Updated Jun 20, 2020
Scala

adik993 / reinforcement-learning-sutton

Star

reinforcement-learning q-learning sarsa gridworld multi-armed-bandits random-walk racecar bandit-algorithm sutton-book td-lambda dyna-q cliffwalking

Updated Mar 4, 2020
Python

raklokesh / ReinforcementLearning_Sutton-Barto_Solutions

Star

Solutions and figures for problems from Reinforcement Learning: An Introduction Sutton&Barto

reinforcement-learning qlearning mountain-car sarsa gradient-descent feature-engineering bandit-algorithm sutton-gambler sutton-book dynaq sutton-gridworld blackjack-montecarlo batch-update maximization-bias infinite-variance rl-sutton semi-gradient-sarsa short-corridor optimal-policy

Updated Jul 16, 2019
Python

Ralami1859 / Adversarial-Multi-Armed-bandit

Star

Adversarial multi-armed bandit algorithms

adversarial-machine-learning bandit-algorithm

Updated Jul 8, 2019
MATLAB

KavishBhatia / MachineLearning

Star

adaboost support-vector-machines stochastic-gradient-descent bandit-algorithm gaussian-discriminant-analysis binary-logistic-regression

Updated Jul 1, 2019
Jupyter Notebook

andrecianflone / thompson

Star

Thompson Sampling Tutorial

reinforcement-learning thompson-sampling bandit bandit-algorithm

Updated Jan 25, 2019
Jupyter Notebook

rasros / evolutionarybandit

Star

Research project on automated A/B testing of software by evolutionary bandits.

matlab genetic-algorithm evolutionary-algorithm bandit-algorithm

Updated Jan 17, 2019
MATLAB

niravnb / Movie-Recommendation-using-Cascading-Bandits

Star

Movie Recommendation using Cascading Bandits namely CascadeLinTS and CascadeLinUCB

recommender-system movie-recommendation bandit-algorithm

Updated May 17, 2018
MATLAB

vinaychetnani / Q-Learning-for-Non-Competitive-Bridge-Bidding

Star

reinforcement-learning deep-learning bandit-algorithm

Updated Jan 23, 2018
Python

znreza / RL_Best_Presentation

Star

This presentation contains very precise yet detailed explanation of concepts of a very interesting topic -- Reinforcement Learning.

reinforcement-learning exploration reinforcement-learning-algorithms sarsa exploitation bandit-learning active-learning td-learning alphago model-based-rl bandit-algorithm passive-learning model-free sarsa-learning rl-vs-supervised-learning rl-vs-unsupervised-learning

Updated Dec 25, 2017

alextanhongpin / go-a-b

Sponsor

Star

A/B testing metrics collection with golang

go golang nomad bandit-algorithm

Updated Oct 28, 2017
Go

Improve this page

Add a description, image, and links to the bandit-algorithm topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the bandit-algorithm topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bandit-algorithm

Here are 20 public repositories matching this topic...

kapshaul / Join-Game

clreda / NORDic

iheartradio / thomas

thunfischtoast / LinUCB

mmalekzadeh / privacy-preserving-bandits

Nth-iteration-labs / streamingbandit-ui

NickKaparinos / Stanford-CS-234-RL-2022

mgpopinjay / bandit-algorithms

vwang0 / causal_inference

simerplaha / reinforcement-learning

adik993 / reinforcement-learning-sutton

raklokesh / ReinforcementLearning_Sutton-Barto_Solutions

Ralami1859 / Adversarial-Multi-Armed-bandit

KavishBhatia / MachineLearning

andrecianflone / thompson

rasros / evolutionarybandit

niravnb / Movie-Recommendation-using-Cascading-Bandits

vinaychetnani / Q-Learning-for-Non-Competitive-Bridge-Bidding

znreza / RL_Best_Presentation

alextanhongpin / go-a-b

Improve this page

Add this topic to your repo