NumerAI: le machine learning rencontre la blockchain.

 

L’intelligence artificielle et la blockchain sont deux secteurs en forte croissance, qui feront sans doute des merveilles dans les 10 ans à venir.

A présent, ce qui distingue le plus ces deux technologies est à mon sens le caractère bien plus prévisible de l’AI: on en parle depuis des années et cela fait longtemps que des films, des articles de vulgarisation (pour le grand publique) ainsi que des publications techniques (pour le métier), esquissent le futur des machines intelligentes en nous donnant un avant-goût des percées futures.

De son côté, la blockchain est une nouveauté qui arrive comme une météorite. Le potentiel disruptif des deux est peut-être identique mais le caractère ponctuel et inattendu de la blockchain, couplé à son étonnant dynamisme, vont lui faire faire des vagues bien plus hautes à court et moyen terme. C’est mon avis, en tous cas.

Ayant travaillé dans les deux secteurs, notamment dans la prédiction AI de données boursières, je me fais un plaisir dans ce post de vous parler de Numerai, un hedge fund blockchain-based qui recrute ses prédictions via blockchain.

Supposons un doctorant français en machine-learning qui ne connait quasiment rien aux banques ni aux hedges funds. Il sait juste que ce monde recrute les meilleurs spécialistes AI de la planète pour les prédictions stock markets, mais aussi qu’il est difficile de se faire remarquer pour de nombreux crack en machine learning. Il voit tout ça comme une nébuleuse où le talent ne fait pas tout: parfois les connaissances bien placées, la proximité géographique et parfois même la chance, permettent à un petit nombre de travailler dans ce secteur velouté.

De son côté, l’hedge-fund n’a pas d’autre solution que de contacter le plus de doctorants possible afin de dénicher la meilleure élite et l’embaucher au plus tôt en interne pour la garder à vie. Cette recherche, difficile et coûteuse, est sans garanties:

  1. on ne peut pas assurer que l’équipe trouvée soit vraiment la meilleure au monde (il est impossible de passer en revue tous les candidats)
  2. on ne peut pas assurer qu’elle puisse fournir les meilleurs résultats (ceux qui seraient moyennés sur un nombre assez important de try&see prédictifs)

Dans ce contexte, lorsqu’un hedge-fund trouve un avantage concurrentiel, il va le protéger à tout prix en payant très cher ses data-scientists afin de les empêcher de rejoindre la société d’à côté. La finance est très compétitive et les gains des uns se font souvent au détriment des autres.

Mais pourrait-on faire du crowdsourcing de talents machine learning? Que se passerait-t-il si ce système en vases clos rencontrait la blockchain?

On assisterait probablement à une inversion de rôles à 180 degrés. La blockchain a le potentiel pour transformer Wall Street d’un ensemble de structures isolées et méfiantes à un pool de partenaires qui collaborent harmonieusement.

Au lieu de compter sur le génie d’une personne ou d’une petite équipe, Numerai fait appel en crowdsourcing à environ 12 000 scientifiques anonymes dans le monde entier, un nombre destiné à croître. Ceux-ci utilisent les databases mises à disposition par la société pour construire des modèles de prédiction du marché boursier, avec les techniques d’intelligence artificielle de leur choix. Ces données, enrichies continuellement via des achats tiers, sont cryptées et anonymisées, ce qui, soit dit au passage, rend plus laborieux les traitements côté client.

Comment ça marche ?

Numeraire est un crypto-token open-source émis sur la blockchain Ethereum par le hedge-fund Numerai. Notez que cette monnaie  est donc émise par une société privée, bien que tout soit ouvert et transparent.

Le token Numeraire suit la norme ERC20.

Vous avez ici l’ABI du contrat et l’adresse du smart-contrat: 0x1776e1F26f98b1A5dF9cD347953a26dd3Cb46671

Les plus courageux peuvent analyser ses transactions ici: https://etherscan.io/address/0x1776e1F26f98b1A5dF9cD347953a26dd3Cb46671

Il y aura en tout 21 millions de tokens Numeraire frappés (minted).

Au début, Numerai a envoyé gratuitement 1 million de tokens aux scientifiques early-adopters. Cela s’est fait en fonction de leur classement historique sur le leaderboard de Numerai, construit sur les performances passées dans les tournois préparatoires. Après cette distribution initiale, le smart-contract émet de nouveaux tokens chaque semaine jusqu’à ce que le maximum de 21 millions soit atteint.

Depuis le 20 juin 2017, les experts peuvent utiliser leurs jetons pour proposer des prédictions. Si elles sont pertinentes, ils gagnent de l’argent (des numeraires, qui sont côtés par exemple ici) sinon ils peuvent perdre leurs jetons.

Quand un scientifique est confiant quant à ses prédictions, il les envoie avec des tokens au smart-contract. Cela se fait depuis le site Web de Numerai sans besoin de gérer des clés privées, de lancer un client Ethereum ou encore d’utiliser le plug-in MetaMask.

Le smart contrat séquestre ces tokens pendant une période suffisamment longue pour avoir le temps de tester la performance sur de nouvelles données (que le modèle n’a jamais vues, c’est une validation à chaud). Personne n’a accès à ces tokens pendant la séquestration, pas même Numerai.

Cette période expirée, Numerai notifie à la blockchain les performances des prédictions. Les scientifiques gagnent des dollars selon un mécanisme de vente aux enchères (Dutch) et peuvent récupérer leurs mises de départ en tokens Numeraire. Ceux qui obtiennent de mauvais résultats (alors qu’ils avaient annoncé une confiance élevée dans leur travail) voient leurs tokens détruits – à jamais – dans Ethereum, via un smart contract publiquement vérifiable.

Les 100 meilleurs modèles sont aussi récompensés en bitcoin pour des montants plus importants.

Chaque tournoi de prédiction a son montant fixe de rémunération finale. Le mécanisme de vente aux enchères répartit ce montant parmi des scientifiques qui soumettent des tuples (c, s)

  • c = confiance en sa prédiction = nombre de Numeraire que le scientifique est prêt à miser pour gagner 1 dollar
  • s = quantité de tokens qu’on veut envoyer avec la prédiction.

La métrique pour l’évaluation des performances est logloss2: on considère qu’un modèle a

  • de bons résultats si logloss < -ln(0.5),
  • de mauvais résultats si logloss >= -ln(0.5)

Les scientifiques sont classés par ordre décroissant de confiance (c) et sont rémunérés s/c dollars jusqu’à ce que le montant de rémunération ne soit épuisé.

Exemple (tiré du whitepaper). Supposons une rémunération de 3000$ pour une prédiction qui se serait ainsi terminée:

  • WSW a une logloss insuffisante: ses 10.000 Numeraire sont détruits.
  • XIRAX reçoit 500$ et ses tokens Numeraire lui sont rendus.
  • PHIL CULLITON reçoit 2000 $ et son Numeraire est rendu.
  • Le Numeraire de DAENRI est détruit.
  • ABRIOSI reçoit 500$, soit 100 $ de moins que son offre parce que le montant pour la rémunération est épuisé.
  • Le protocole rend les tokens à tous les scientifiques, après ABRIOSI, qui ne reçoivent aucun dollar.

Depuis sa création, l’entreprise a reçu environ 896 000 modèles pour un total de presque 50 milliards de prédictions.

 

***

Numerai ne déplace pas seulement la compétition de petites équipes embauchées en interne à des individus isolés. Il récupère les prédictions et les agrège dans un méta-modèle qui va décréter en automatique la stratégie d’investissement. Le fond ne cherche pas le meilleur modèle en absolu, mais synthétise les meilleurs dans un seul méta-modèle viable. Numerai est ainsi le premier smart-contract décentralisé collaboratif alimentant un hedge fund. Les scientifiques concourent pour gagner des bitcoin avec la certitude que la blockchain va les rémunérer trustless en fonction de la performance de leurs modèles.

***

Il s’agit là d’un projet expérimental, mais on entrevoit déjà qu’il pourrait être une étape fondamentale vers un hedge-fund qui irait même au-delà de Numerai: planétaire, pleinement décentralisé, leaderless, n’appartenant juridiquement à personne et régi par un protocole implémenté dans un software blockchain. Tout comme le bitcoin.

Potentiellement, l’ubérisation ultime des prédiction boursières

(je précise que le mot ubérisation n’est pas tout à fait  correct: Uber n’est pas une plateforme collaborative, mais une plateforme de mise en relation)

***

Il est clair que Numerai ne sert pas seulement à dénicher des talents isolés et relativement inconnus. Le caractère ouvert et pseudonyme des blockchains fait que même les plus grands spécialistes peuvent participer à une course aux résultats, on ne peut plus fair-play.

Numerai a un accès libre, blockchain oblige. Toute personne est la bienvenue par défaut et nul ne peut être exclu: participation ouverte et anonymat sont les clés. Prenons un grand spécialiste AI, aujourd’hui en poste chez une GAFA. Il peut aussi travailler sur Numérai, modulo les clauses restrictives sans doute établies par son employeur (par ailleurs difficiles à faire respecter vu le caractère pseudonyme de la blockchain).

Supposons maintenant que ce gros spécialiste AI soit indien, qu’il réside temporairement à Hong-Kong (où il touche son salaire GAFA). Il va aussi recevoir des dollars et des bitcoins de Numerai, versés de son siège à San Francisco. Il convertit 50% de ces BTC en dollars et dépose l’ensemble des dollars sur un compte bancaire USA (pour des raisons fiscales). Les BTC restants vont sur son Nano Ledger Wallet 100% privé, en cold storage.

Autant dire que le régulateur a du pain sur la planche avec ce type de projets, encore marginaux mais de plus en plus courants. Si la tentative de stopper le peer-2-peer via Hadopi lui avait déjà donné des migraines, qu’en sera-t-il avec la blockhain, qui lui soumet un cas Hadopi-like par mois (minimum) ?

Le fait est que le bitcoin a cassé le paradigme. Pour la première fois on dispose d’une monnaie planétaire, sans frontières, qui voyage ~300 fois plus vite que le virement en fiat-money et qui permet des échanges anonymes, bien que traçables.  Face à cela, le régulateur est désemparé et j’en profite pour donner mon avis sur la question de la régulation. Sans chercher à comprendre si c’est juste, souhaitable, bon ou mauvais, je crois que la blockchain passera souvent en force, tout simplement parce que cela sera la seule issue possible (à moins d’avoir un bouton magique pour éteindre Internet).

***

  Numerai est côté sur Bittrex depuis le 23 juin 2017. 

Côté durant les premières heures à ~0.011 BTC, il a eu un pic spéculatif autour de 0.070 BTC et est retombé depuis à presque le double de ses premiers échanges (du pump and dump classique).  Attention: ceci n’est en aucun cas un conseil d’investissement.

Le titre est clairement sous les feux d’une grande spéculation, mais comme de nombreux projets blockchain, son issue à long terme s’annonce binaire: soit la mort (dans ce cas il aura servi à d’autres pionniers), soit la lune.

Maintenant le fait que Numéraire arrive au but ou pas de son parcours reste une question secondaire: il est clair que les hedge-funds sont un autre secteur en proie à une future disruption blockchain.

Elle vient juste de commencer.

 

 

2 pensées sur “NumerAI: le machine learning rencontre la blockchain.”

  1. Ok On paye des types a faire des prévisions exactes.
    Qui va se servir de ces predictions et comment?
    La je pige pas le business model

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *