Critère de Kelly

Formule du critère de Kelly et sa démonstration mathématique

Dans un investissement financier risqué, on peut gagner, on peut perdre, c'est là tout l'enjeu et la question.
Partant d'un certain capital, plus l'investissement nous semble sûr, plus on devrait miser une somme importante. C'est un 1er point.
Par ailleurs, même si le pari ne nous semble pas des plus assurés, mais que le gain en cas de victoire est élevé, là aussi plus on a tout intérêt à investir gros. "Gros": bien sûr selon notre capacité d'investissement, notre capital.
Inversement, plus l'investissement est risqué, c'est-à-dire plus la probabilité de perte est importante, plus la prudence indique d'investir une faible part de notre capital seulement.

Comment donc estimer alors la juste part du capital à investir ? estimer cette "faible" part, ou ce quot;gros investissement" ?
La réponse exacte à tout ceci est donnée par la formule mathématique, aussi connue sous le nom de critère de Kelly.

Dans une succession d'investissements risqués, l'utilisation du critère de Kelly conduit en théorie à un capital plus élevé que toute autre stratégie à long terme. Cette formule donne ainsi le rendement maximal théorique sur l'ensemble des investissements.

L'objet de ce qui suit est de détailler cette formule ainsi que les éléments mathématiques qui prouvent cette formule.

Investissement risqué

On dispose d'un capital financier W (pour "Wealth", ou richesse), une certaine somme d'argent, qu'on souhaite investir dans une opération risquée: investissement bancaire, boursier, ou encore pari (pari sportif par exemple).
Investissement risqué car on estime qu'il y a une certaine probabilité p que celui-ci nous rapporte au taux net a, et une probabilité q qu'il entraîne une perte au taux net b.
Dans ce contexte, et où on cherche bien sûr à faire prospérer notre capital opération après opération, la question qu'on peut (doit ?) se poser est: combien dois-je investir sur une opération donnée ? plus précisément: quelle part de mon capital dois-je miser ?
Selon les valeurs des probabilités et des taux, investir tout mon capital d'un coup peut m'entraîner de lourdes pertes, voir la banqueroute. D'un autre côté, investir peu dans une situation plutôt avantageuse aura pour conséquence un certain manque à gagner…
Quelle fraction de mon capital faut-il donc consacrer à un investissement donné, bien sûr en fonction des paramètres de l'investissement: probabilités et taux.

Le critère de Kelly (Kelly criterion) répond à cette question, avec une formule qui permet de calculer cette fraction de capital optimale à investir. Optimale car cet investissement, respectant le critère de Kelly, donne le rendement maximal théorique.

Formule mathématique de Kelly

John Larry Kelly Jr. (1923 - 1965) était un scientifique américain qui travaillait aux Bell Labs, notamment sur la transmission d'information via des réseaux à la suite de C. Shannon (pionner dans la théorie de l'information).
Il est maintenant connu pour sa formule mathématique qui permet d'estimer la part de richesse, ou de son capital financier, à risquer dans un investissement risqué.
Ce critère de Kelly est la formule mathématique

f ^* = p/b − q/a

où

p est la probabilité de la victoire estimée
q = 1 − p est la probabilité de perte estimée
a est le taux net gagné en cas de la victoire et b est le taux net de perte, en cas de perte,

Un exemple

Par exemple, je dispose d'un capital W = 100 € dont je souhaite investir une certain part f dans un investissement risqué tel que:

avec la probabilité p=60%, l'investissement rapporte un taux net a = 10%
avec la probabilité q=40%, l'investissement me coûtera une perte avec un taux net b = 7%

Combien investir de mes 100 euros ?
La part optimale f ^* est donnée par la formule de Kelly:

f ^* = 0,6/0,07 − 0,4/0,1 ≃ 4,6 %

La mise optimale est donc de Wf = 100×4,6% = 4,6€ sur mon capital de 100 euros.

Cas particuliers

Quelques valeurs des paramètres qui sont des cas bien particuliers.

Le cas b = 1 correspond à un pari avec perte sèche en cas de perte. L'investissement est totalement perdu en cas de défaite. C'est le cas des paris sportifs par exemple.
Si par contre a = 1: la mise est doublée en cas de victoire.

Dans le cas des paris sportifs, on a donc b = 1 et la cote en cas de victoire est c = a + 1 ⇔ a = c−1. Par exemple, si je mise 10 euros avec la cote c = 2,5:

si je perds, je perds purement et simplement mes 10 euros
si je gagne, je remporte 10×c = 10×2,5 = 25€, soit un gain net de 10×a = 10×1,5 = 15€

L'application et l'utilisation du critère de Kelly dans les paris sportifs est détaillé par exemple sur cette page.

Preuve mathématique de la formule de Kelly

L'étude et la preuve complète de la formule du critère de Kelly peuvent être trouvées dans sa bibiliographie, notamment "A New Interpretation of Information Rate" puis, par E.O. Thorp, un de ses successeurs, dans "Optimal Gambling Systems for Favorable Games".
J'en donne ici une version un peu simplifiée.

Difficultés et idées de la démonstration

On étudie ici un système dynamique à temps discret: on part d'un capital W₀ dont on investit une partie aboutissant à une nouvelle valeur du capital total, dont on réinvestit une part …
On aimerait donc avoir une formule de récurrence qui permet de passer d'un capital au suivant. La difficulté réside dans le fait que le processus n'est pas déterministe mais stochastique: on a une probabilité d'obtenir un certain nouveau capital et une probabilité d'en obtenir un autre.
L'idée pour surmonter cette difficulté n'est pas de chercher directement une formule de récurrence, d'un capital au suivant, mais de considérer directement un certain nombre T d'opérations consécutives dont laquelle il y aura eu des gains et des pertes. Pour un nombre T important, on pourra estimer le nombre de gains et de pertes en fonction des probabilités.
On reviendra alors, à partir de cette relation globale, à une relation de récurrence "moyenne", plus précisément un taux moyen, d'un investissement à l'autre.
Il ne restera plus qu'à chercher à otpimiser ce taux…

Variation pour un gain ou une perte

On commence donc par chercher à exprimer la "simple" variation du capital à un pas de temps (ou plutôt un pas d'investissement).
On possède un capital (ou bankroll, suivant le contexte), W dont on mise une fraction f.
Par exemple: un capital de W = 50€ et duquel on mise une part f = 10%, soit une mise de m = W×f = 5€ dans l'investissement risqué suivant:

Gain: avec une probabilité p et un taux net de gain a = 8%
Si je gagne effectivement, ma mise sera augmentée de ce taux pour devenir m(1+a) = 5,40€
Mon nouveau capital W' sera alors constitué de la partie de mon capital auquel je n'ai pas touché W(1−f) = 45€ et de ma mise augmentée, soit
W' = W(1−f) + m(1+a) = 45 + 5,40 = 50,40€
Perte: avec une probabilité q et un taux net de perte b = 5%
Si je perd donc, ma mise sera dévaluée de ce taux pour devenir m(1−a) = 4,75€
Mon nouveau capital W' sera alors constitué de la partie de mon capital auquel je n'ai pas touché W(1−f) = 45€ et de ma mise dévaluée, soit
W' = W(1−f) + m(1−b) = 45 + 4,75 = 49,75€

En résumé, et dans le cas général, lorsque je gagne mon capital devient

W' = W(1−f) + m(1+a)

soit, avec la mise d'une part du capital m = Wf, on obtient

W' = W(1−f) + Wf(1+a) = W(1+fa)

De même, lorsque je perds, le capital devient

W' = W(1−f) + m(1−b) = W(1−fb)

En résumé, si je gagne, mon capital est multiplié par 1+fa tandis que si je perds mon capital est multiplié par 1−fb.

Taux sur plusieurs mises successives

On s'intéresse maintenant à obtenir la meilleure augmentation du capital sur un ensemble successif de mises et pertes/gains.
Disons par exemple que je mise T fois en tout parmi lesquelles je gagne N fois et perd M fois, avec bien sûr T = N+M.
L'ordre des victoires et pertes n'importe pas et à chaque victoire je multiplie mon capital par 1+fa et à chaque défaite je multiplie par 1−fb. En tout, en partant du capital W₀, avec N victoires et M défaites, mon capital devient ainsi

W_T = W₀(1+fa)^N(1−fb)^M

On s'intéresse au taux permettant de passer d'un capital au suivant. On considère ainsi que la suite des capitaux est une suite géométrique qui augmente avec le taux r donc avec la raison 1+r, c'est-à-dire

W_T = W₀ (1+r)^T

Ce taux d'augmentation r est le taux d'augmentation moyen de la suite géométrique, appelé à ce titre par Kelly le taux géométrique moyen (geometric growth rate).
Il s'agit du taux, constant à chaque étape, et qui permet la même variation globale: c'est la définition d'un taux moyen.

On a donc, en identifiant les deux dernières expressions

(1+r)^T = (1+fa)^N(1−fb)^M

ou encore en prenant la racine n-ième:

1+r = (1+fa)^N/T(1−fb)^M/T

Maintenant, en revenant à la signification des paramètres, la fraction N/T est le ratio entre le nombre N de gains sur le nombre total T d'investissements. Ce ratio tend vers la probabilité p de victoire sur un grand nombre T d'investissements (loi des grands nombres).
De même l'autre fraction M/T est le ratio du nombre de pertes sur le nombre total et tend cette fois vers q = 1−p.
On trouve donc le taux géométrique moyen asymptotique (c'est-à-dire lorsque T tend vers l'infini):

1+r = (1+fa)^p(1−fb)^q

soit encore le taux géométrique moyen recherché

r = (1+fa)^p(1−fb)^q − 1

Graphique: variation du taux

La courbe représentant le taux géométrique moyen trouvé ci-dessus en fonction de la fraction f du capital investi est dessinée ci-dessous. On peut y faire varier à loisir les paramètres: probabilité estimée de victoire (et donc de défaite), et taux nets en cas de pertes gain et pertes.

Variation du taux de retour r en de la part de capital misée f

Détermination de l'optimum

On cherche maintenant à calculer exactement la fraction f ^* qui donne le taux de retour, ou taux géométrique moyen, maximum.
On considère pour cela le taux géoémtrique moyen r trouvé précédemment comme une fonction de la part f misée. Mathématiquement, pour trouver les variations et les valeurs extrêmes (maximums et minimums), on calcule la fonction dérivée:

r' = dr/df = pa(1+fa)^p−1(1−fb)^q − qb(1+fa)^p(1−fb)^q−1

soit encore, en factorisant par l'expression de r

r' = r pa/ 1+fa − qb/ 1−fb

On cherche alors la valeur critique f ^* telle que cette dérivée soit nulle, soit

pa/ 1+f ^*a − qb/ 1−f ^*b = 0 ⇔ pa(1−f ^*b) = qb(1+f ^*a) ⇔ f ^*ab(p+q) = pa − qb

On se rappelle alors que les probabilités p et q de victoire et défaite sont reliées par p = 1−q ⇔ p+q=1 et l'expression précédente se réécrit alors

f ^*ab = pa − qb

soit alors, en divisant par ab:

f ^* = p/b − q/a