Radjaïdjah Blog

mardi 10 juin 2014

Casino Bitcoin

Avec l'avènement des cryptodevises décentralisées ont naturellement émergé des casinos en ligne tels Satoshi Dice (un site pionnier qui a rapporté une petite fortune à son fondateur), Just Dice, ou Prime Dice. Une liste de casinos basés sur le bitcoin peut être trouvée sur Bitcoin Dice (on y trouve notamment Every Dice, Dice Coin, Bitcoin Video Casino, Ice Dice, Satoshi Bones, Play Tin, Lucky Hash, Betcoin Dice, Dice Now, Bitoomba Dice, BitBattle.me, Jackpot Dice, SuperDICE, Mystery Dice, etc).

Ces casinos sont des paradis pour les partisans du libertarianisme, car : pas de contrôle à l'entrée, pas de personnes interdites de casino, pas de contrôle d'alcoolémie ou de dopage, pas de demandes de provenance de l'argent servant à payer les jetons... des no man's lands juridiques où les croupiers et les joueurs sont livrés à eux-mêmes.

Un joueur peut choisir un gain relatif à la mise (et le site y associera une probabilité de gagner) ou une probabilité de gagner (et le site y associera un gain relatif à la mise). Des jeux très simples basés sur un tirage au sort uniforme octroient un résultat et y associent une perte ou un gain.

Ces sites sont bien plus attractifs que les casinos classiques, proposant un avantage pour la maison (House edge) aux alentours de 1%, bien inférieur aux casinos classiques (par exemple 2,7% pour la roulette européenne et 5,3% pour la roulette américaine).

Les adeptes de martingales y trouvent leur compte, ou pas. À court terme les hauts gains sont possibles, si le joueur sait s'arrêter ; à long terme les risques associés aux lois des séries (distributions de Taleb) sont rédhibitoires pour les joueurs et profitables au casino. La maison gagne toujours.

Full disclosure : l'auteur est un investisseur de Just Dice (Mise à jour juillet 2014 : l'auteur était un investisseur, le site ayant depuis fermé suite à des innovations de la législation canadienne. Les bons temps sont derrière nous).

mardi 7 janvier 2014

La triche aux échecs

Une épreuve difficile que celle proposée par Gregory Conti et James Caroland à leurs élèves : restituer par écrit les cent premiers chiffres de pi, le rapport entre le périmètre d'un cercle et son diamètre (3,14159265...). La particularité de ce test est que les élèves avaient explicitement la possibilité de tricher et que la note attibuée reflèterait l'efficacité et l'originalité de la méthode employée, sur la base : pas vu, pas pris. La synthèse de cette expérience Embracing the Kobayashi Maru: Why You Should Teach Your Students to Cheat en recense certaines (antisèche cachée dans un faux livre ou une fausse canette, sur un ordinateur, réponse codée en mandarin...) qui le soulignent bien : tricher demande parfois de faire preuve de créativité.

C'est en pratique dans le domaine des échecs que ce constat a été illustré récemment. Tricher lors d'une partie, c'est jouer des coups que l'on n'a pas trouvés soi-même, mais par une entité extérieure (un autre joueur, ou un ordinateur[1]). Quelles que soient les motivations qui animent un tricheur, le phénomène est considéré comme un grave manquement à l'éthique du jeu et toute tentative avérée discrédite un joueur de façon quasi-irréversible (l'honneur c'est comme les allumettes...). Au-delà de cela, les deux exemples suivants démontrent une certaine créativité dans la mise en place de la triche.

Dans le premier cas, trois Français ont agi de concert pour tricher. Si on voulait romancer un peu la méthode déployée, il y aurait "l'analyste", "le messager", et "le joueur". Le joueur participe à un tournoi et dispute les parties. Le messager est présent dans la salle du tournoi, comme spectateur. Enfin, l'analyste est dans un endroit externe, avec un ordinateur. Il suit la partie du joueur sur internet, fait analyser les positions par un logiciel échiquéen (type Fritz, Shredder, Houdini, ou Rybka), et note le coup proposé par l'ordinateur, qui joue donc la même partie que le joueur. Il envoie ensuite le coup au messager par SMS, en le dissimulant dans un anodin numéro de téléphone (en cryptologie, on parlerait de stéganographie) : certains chiffres du numéro codent la notation internationale du coup à jouer. Le messager déchiffre le SMS et va signaler le coup à jouer au joueur en se plaçant à certains endroits prédéterminés de la salle pendant un certain temps. Le joueur repère alors les positions successives du messager, et joue le coup correspondant. L'adversaire réplique, la nouvelle position est aussitôt retransmise sur Internet, et l'analyste peut enchainer. En remplaçant le joueur par un enfant de dix ans, on assisterait à la démonstration d'un prodige.

(source)

Dans le second cas, il s'agit d'un joueur bulgare qui agit sans complice ; le joueur a un ordinateur miniature (type smartphone) muni d'un logiciel d'analyse dans sa chaussure et communique avec à l'aide de ses orteils. Peut-être une inspiration de la nouvelle Nora says "Check" de Martin Gardner ? Bien que la triche n'ait pas été formellement avérée, il existe un faisceau de présomptions assez impressionnant, basées sur le comportement du joueur durant certains tournois, et, plus intéressant, sur ses performances et sur les coups qu'il a joués. En effet d'une part les résultats enregistrés lors de ces tournois constituaient une aberration statistique en regard des performances attendues en vertu du classement ELO, d'autre part de très fortes corrélations ont été relevées entre les choix du joueur et les coups proposés par un ordinateur disputant la même partie. Il faut en effet savoir que, les ordinateurs basant leurs choix sur le calcul pur et les humains donnant une part plus importante à l'intuition, dans une même position ils ont tendance à jouer des coups différents. Ce qui a amené un M. Regan à proposer une sorte de test de Turing échiquéen[2] indiquant, au vu de ses coups, à quel point un joueur est susceptible d'être un ordinateur. Ce même type de méthodes est utilisé sur certains sites d'échecs en ligne pour détecter les internautes utilisant un programme pour jouer à leur place.

(source)

Complément : A history of cheating in chess, en 4 parties. 1 raconte l'histoire d'une feinte et un épisode de vraie triche, 2 parle du Turc mécanique et de l'avènement des ordinateurs aux échecs, 3 évoque l'Allemand Allwermann qui préfigure le second cas ci-dessus, et enfin 4, à partir de deux anecdotes sur un apport minimal d'information externe, envisage les performances d'un duo homme-machine (ce que Kasparov appelle advanced chess).

Bonus : Major Fraud, un reportage sur des tricheurs en carton au jeu télévisé Who wants to be a Millionaire (épisode qui a peut-être inspiré le film Slumdog Millionnaire).

En conclusion, il n'y a pas de conclusion. Bonne année 2014 !

Notes

[1] Les ordinateurs sont aujourd'hui meilleurs que les humains aux échecs. Sauf peut-être en chessboxing, si on commence par la boxe.

[2] Une illustration de la logique sous-jacente est apportée par la parabole du golfeur.

mercredi 9 janvier 2013

D'où provient le n° de sécurité sociale ?

Le numéro de sécurité sociale en France, ou numéro d'inscription au répertoire des personnes physiques (abrégé en NIRPP ou plus simplement NIR) est un code alphanumérique servant à identifier une personne dans le répertoire national d'identification des personnes physiques (RNIPP) géré par l'Insee. Il est construit à partir de l'état civil transmis par les mairies (sexe, année et mois de naissance, département et commune de naissance, numéro d'ordre du registre d'état civil). Il s'agit d'un « identifiant fiable et stable, conçu pour rester immuable la vie durant ».

En France, le numéro de sécurité sociale est une bonne clef primaire pour indexer les citoyens ; c'est par exemple le numéro de carte vitale de l'assurance maladie. Il n'est cependant pas parfait, entre autres car il peut exister des doublons. Mais d'où vient-il ? Selon l'article mentionné ci-dessus :

L'inventeur de l'actuel numéro de Sécurité sociale est le contrôleur général des armées René Carmille, spécialiste de la mécanographie par cartes perforées[1], qui le destinait à préparer secrètement la remobilisation de l'Armée, dissoute par l'Armistice de 1940.

À l'origine, René Carmille avait prévu un numéro matricule à 12 chiffres, appelé « numéro de Français » :

  • deux pour l’année de naissance ;
  • deux pour le mois de naissance ;
  • deux pour le département de naissance ;
  • trois pour la commune de naissance (aucun département ne comporte plus de 999 communes) ;
  • trois pour un numéro d’ordre dans le mois de naissance;

Ayant un objet civil, et non militaire, le numéro de Français devait inclure les femmes. C'est pourquoi fut ajouté un 13e chiffre en première colonne, pour le sexe, 1 ou 2. Le numéro d'identité n'est pour Carmille qu'un des éléments d'un vaste système de traitement d'informations statistiques, destinées à gérer l'ensemble des affaires économiques, civiles et militaires. Après des errements consistant à donner une signification aux chiffres non utilisés (3 à 9) de la première colonne, la première composante du numéro d’identification est définitivement limitée au sexe en mai 1945 : 1 pour masculin, 2 pour féminin. L’armée reconstituée continua d’utiliser le « numéro Carmille » et donna le nom de son créateur à des centres de recrutement, de mécanographie ou de télécommunications.

Ce que Wikipédia appelle errements est précisé dans le 20e rapport d'activité de la CNIL de 1999 :

Construit sous l’égide de l’INSEE et certifié par lui à partir d’éléments d’état civil transmis par les mairies (sexe, année et mois de naissance, département et commune de naissance, numéro d’ordre du registre d’état civil), le NIR constitue un identifiant fiable et stable, conçu pour rester immuable la vie durant. Cependant, créé sous le régime de Vichy pour classer les fichiers administratifs et établir des statistiques démographiques, le NIR a été aussitôt utilisé pour distinguer « juifs » et « non-juifs » selon les critères des autorités antisémites de l’époque, la première position du numéro relative au sexe des personnes ayant été complétée sur cette base. Cette mémoire restera attachée au NIR. Il est vrai que la structure de ce numéro pouvait faciliter de telles discriminations. De fait, le NIR est le reflet, sous forme numérique, de l’identité de chacun.

L'article sur René Carmille relate plus en détails cet historique. À la libération, le Service national des statistiques (SNS) devenait l’Insee, et le numéro Carmille devenait le numéro de sécurité sociale, toujours utilisé aujourd'hui.

Notes

[1] La mécanographie par cartes perforées, ancêtre de l'ordinateur, sera utilisée par les Nazis avec le concours d'IBM pour améliorer la logistique des camps de concentration. Cela est détaillé dans la troisième partie du film The Corporation.

jeudi 15 novembre 2012

Can one grow intuition?

This is the 100th entry on the blog! Cheers!

After the 2012 US elections, statistician Nate Silver has known his fifteen minutes of fame when it appeared that his predictions regarding the results had been fulfilled despite the strong opposition by a good number of opponents.

Now, the same Nate Silver had previously authored The Signal and the Noise - Why so many predictions fail, but some don't, where he reports an anecdote about the 1997 Kasparov vs Deep Blue match (mentioned in the entry about the future of information science).

Nevertheless, there were some bugs in Deep Blue’s inventory: not many, but a few. Toward the end of my interview with him, [Murray] Campbell somewhat mischievously referred to an incident that had occurred toward the end of the first game in their 1997 match with Kasparov. “A bug occurred in the game and it may have made Kasparov misunderstand the capabilities of Deep Blue,” Campbell told me. “He didn’t come up with the theory that the move it played was a bug.” The bug had arisen on the forty-fourth move of their first game against Kasparov; unable to select a move, the program had defaulted to a last-resort fail-safe in which it picked a play completely at random. (...) Kasparov had concluded that the counterintuitive play must be a sign of superior intelligence. He had never considered that it was simply a bug.

Years later, at a authors@google talk interesting to have a look at in its entirety, Garry Kasparov (whose famous game against Topalov can be seen here) is asked if he relies on intuition to make decisions in chess[1]. His answer:

It's the most valuable quality of a human being in my view. Yeah, it's probably... we live at a time when we just want to touch something before we can make our opinion about the subject. I believe that intuition is like any other muscle. So, like people know that if you go to the gym you improve your physical conditions, they know that for training memory, there're also exercises, but intuition is the same. So you have to learn how to trust your intuition. My view is that we similarly undermine the importance of intuition because intuition means taking too much risk. And we, whether we like it or not, we live in a risk adverse culture. And intuitive decision very often cannot be explained into terms that should be required by corporate cullture or by your other family members. So, in my view, by adding this quality of intuition to the decision-making process, we can dramatically improve the results.

"Can intuition be developed?" is half-counter-intuitive, so to say, in the sense that people who have good intuition will say "yes", and people who have a bad intuition will say "no". Still, anyone can observe that a common quality shared by the chess player Bobby Fischer (evoked in the movie Searching for Bobby Fischer), and the poker player Stu Ungar[2] (whose life is narrated in High Roller: The Stu Ungar Story) is that both had a very powerful intuition. Everyone can draw his own conclusions.

Notes

[1] The next question in the talk is about the importance of psychology. From Kasparov's answer: "It could actually work in a very strange way when you're facing the computer because many computers, even today, have their own strengths and own weaknesses. And if you can understand so it may help you to design the game which will be the most unpleasant for certain computer. Because it's actually machine, it might sound very odd, but machine definitely has a "personality" and it very much depends on the people behind the computer. So, some of the machines are playing more aggressive chess; some play less aggressive chess. And again, I don't know whether it's an irony or not, but the Israeli-made computers are more aggressive than the German-made computers."

[2] Stu Ungar, jewish, clever, lover of poker, died of a heart failure due to his excesses.

vendredi 22 juin 2012

Dobble

Le jeu Dobble est né d'un concept de Denis Blanchot qui semble simple : 55 cartes, 8 symboles différents par carte, et toujours un et un seul symbole commun entre chaque carte. Il faut être le plus rapide à trouver ce symbole commun[1].

Exemple : quel est l'unique symbole commun aux cartes suivantes ?

[ ⚑ ★ ☋ ◐ ☎ ☕ ☣ ☯ ] et [ ☪ ☕ ♞ ♬ ⚓ ⚷ ✈ ➑ ]

Une question naturelle qui se pose est : comment construire un ensemble de cartes muni de cette propriété : pour toute paire de cartes, il existe un un et seul symbole commun ?

En indexant les symboles, par des entiers, la question peut être reformulée de la manière suivante : comment construire une famille \(S_i\) de parties de \([|1,n|]\) telles que \(\forall (i,j): \# S_i = \# S_j\) et \(\# (S_i \cap S_j) =1\) ?

Pour commencer, prenons 2 symboles par carte. Si on note [ 1 2 ] la première carte, alors la deuxième carte devra être de la forme [ 1 3 ], puis on a deux solutions pour une troisième carte : [ 1 4 ] ou [ 2 3 ]. Seulement, dans le premier cas, il n'est plus possible d'ajouter d'autres cartes qui ne soient pas de la forme [ 1 x ], ce qui signifie que 1 est un unique symbole commun à chaque paire de cartes, ce qui n'est pas vraiment ce qu'on veut. Dans l'autre cas, on obtient un système constitué de { [ 1 2 ], [ 1 3 ], [ 2 3 ] } qui répond bien à nos attentes.

Plan de Fano Avec trois symboles par carte, on peut construire de même un ensemble de façon itérative, dont chacun pourra s'assurer que chaque couple de cartes possède exactement un unique chiffre en commun : { [ 1 2 3 ], [ 1 4 5 ], [ 2 4 6 ], [ 3 5 6 ] }. On a aussi la possibilité suivante :

[ 1 2 3         ]
[ 1     4 5     ]
[   2   4   6   ]
[ 1         6 7 ]
[   2     5   7 ]
[     3 4     7 ]
[     3   5 6   ]

Soit maintenant T l'ensemble des parties de \([|1,7|]\) à 2 éléments. Un élément de T ne peut être inclus dans deux cartes différentes, sinon leur intersection aurait strictement plus d'un chiffre en commun. De plus, à chaque carte peuvent être associés 3 éléments de T, nécessairement différents d'une carte à l'autre, ce qui fait 21 éléments, soit le cardinal de T. Conséquemment chaque élément de T est inclus dans une et une seule des cartes.

Un ensemble \(S\) à \(n\) éléments et un ensemble de parties \(K\) de \(S\) à \(k\) éléments (blocs) tels que chaque partie de \(S\) à \(t\) éléments soit incluse exactement dans un bloc constituent un système de Steiner \(S(t,k,n)\). Le jeu de cartes précédent est donc isomorphe à \(S(2,3,7)\), ce qu'on peut illustrer par le plan de Fano ci-dessus, où les symboles sont les chiffres et les cartes les lignes. Deux lignes quelconques (blocs) s'intersectent toujours au niveau d'un unique symbole.

Remarquons enfin qu'à chaque carte on peut associer un mot binaire, les chiffres codant les positions des bits allumés. Les 7 mots sont tous sur une sphère de rayon 3 et Hamming-équidistants de 4, leur énumération forme la matrice d'incidence du plan de Fano.

[ 1 1 1 0 0 0 0 ]
[ 1 0 0 1 1 0 0 ]
[ 0 1 0 1 0 1 0 ]
[ 1 0 0 0 0 1 1 ]
[ 0 1 0 0 1 0 1 ]
[ 0 0 1 1 0 0 1 ]
[ 0 0 1 0 1 1 0 ]

Pour finir, un petit exercice au lecteur : le jeu de Dobble est-il, tel le jeu de Set, un système de Steiner, et si oui, lequel ?

La réponse : comme l'explique très bien cet article, la structure sous-tendant le Dobble est le plan projectif d'ordre 7 \(PG(2,7)\) (le plan de Fano est d'ordre 2), qui est aussi le système \(S(2,8,57)\). Le jeu devrait donc avoir en principe 57 symboles différents et 57 cartes, or il n'en comporte que 55, apparemment pour des raisons techniques de production. Il en résulte une certaine asymétrie, puisque 15 symboles apparaissent moins fréquemment que les autres, dont un (, celui commun aux deux cartes manquantes) pourrait être qualifié de "rare". Les plus malins en déduiront éventuellement des stratégies gagnantes basées sur ces statistiques.

Notes

[1] Le jeu existe en 5 modes : la tour infernale, le puits, la patate chaude, attrapez-les tous, le cadeau empoisonné.

lundi 14 mai 2012

Las Vegas Parano

Casino roulette

‒ Bonjour, c'est votre neveu Joe qui m'envoie, je cherche un emploi, et apparemment ici c'est sympatique et bien rémunéré.
‒ Oui, très bien. Vous connaissez la maison ? Vous savez comment on fonctionne ?
‒ Un peu. D'après ce que j'ai compris, les clients misent, et certains gagnent, mais la plupart perdent, en en moyenne la maison est gagnante.
‒ Exactement. Nous faisons notre bénéfice grâce au hasard. Plus précisément, grâce aux mathématiques.
‒ Personne n'essaie de tricher ?
‒ Si bien sûr. Nous avons une équipe de surveillance dont l'objectif est de débusquer toute tentative de tricherie. On en a mis plus d'un en prison !
‒ Et si par malchance tout le monde gagnait en même temps, honnêtement ?
‒ C'est peu probable, mais nous y avons pensé, bien sûr. Pour nous protéger, nous avons un plafond de redistribution qui limite fortement nos pertes si beaucoup de nos clients venaient à gagner simultanément.
‒ Donc les gains de la maison sont perpétuellement assurés en vertu de la loi des grands nombres de la théorie des probabllités, et des règles qui limitent les pertes en cas de gain collectif. Ça me paraît très raisonnable. Je viens !
‒ Excellent. Bienvenue chez Allianz !

lundi 7 mai 2012

Open data footballistique

L'open data surgit parfois dans des domaines plutôt inattendus, comme le football.

Des magazines tels que FourFourTwo (The Thinking Fan's Football Website) suggèrent de construire des analyses sur la base de données recueillies au cours d'un ou plusieurs matchs, voire plusieures saisons, au sein d'une zone de statistiques. Des sites comme Footytube offrent des APIs certes encore rudimentaires mais néanmoins prometteuses.

Evidemment on peut faire dire aux chiffres n'importe quoi, en politique, heureusement cela ne risque pas d'arriver dans les univers aussi teintés d'objectivité et de bonne foi que ceux des débats sportifs.

Alors, tout en gardant en vue que corrélation n'implique pas causalité, on peut se demander si les métriques de performance sauront apporter des bases saines aux analyses footballistiques, sachant que dans ce domaine il y a ce qu'on voit, et ce qu'on ne voit pas. Un article des excellents Cahiers du Football intitulé Passer aux stats supérieures apporte peut-être des premiers éléments de réponse.

jeudi 15 mars 2012

Six mois

Après 6 mois, le bilan du nombre mensuel d'entrées est le suivant :

6mois - Entrées

Et voici le nombre hebdomadaire de visites comptabilisées depuis l'installation d'un analyseur de traffic.

6 mois - Visites

C'est un début, le Radjaïdjah Blog va-t-il tenir dans la longueur ? Rendez-vous dans six mois.

vendredi 27 janvier 2012

2% des statistiques sont fausses

Grâce aux statistiques, il est possible de se représenter un fait ordinaire comme une coïncidence extraordinaire, peut-être dans l'esprit du miracle des 5 couleurs.

Les statistiques, c'est bien connu, sont comme les bikinis : ce qu'elles révèlent est suggestif, ce qu'elles dissimulent est essentiel.

Exemple très simple (et très classique) : vous passez un test afin de déterminer si vous êtes touché-e par une maladie mortelle qui affecte une personne sur 10 000. Le test est fiable à 99%. Vous êtes positif-ve. Quelle est la probabilité que vous soyez atteint-e par la maladie (réponse dans le Ted Talk ci-dessous) ?

Le fait que les statistiques et probabilités soient parfois difficiles à comprendre et à interpréter a certains avantages (qui ne seront pas détaillés ici) mais peut également être néfaste.

Ainsi, le statisticien Peter Donnelly[1] expose lors d'un Ted Talk le cas d'un procès où non seulement l'expert appelé à témoigner présente des conclusions statistiques erronées en regard des faits, mais en plus un journaliste[2] vient empirer la situation. Et, comme chacun le sait même sans avoir vu Twelve Angry Men, les membre du jury sont potentiellement très influençables par les statistiques qui leur sont fournies.

Sur un autre registre, de nombreux politiciens[3] et leurs communiquants manipulent les chiffres afin de présenter des constats biaisés, avant de proposer leurs programmes. Les livres suivants éclairent un peu le sujet :

  • How to Lie with Statistics (Comment mentir avec des statistiques) de Darrell Huff
  • Fooled by Randomness (Le Hasard sauvage), de Nassim Nicholas Taleb
  • Freakonomics de Steven Levitt

Certaines de ces intoxications statistiques sont parfois plus ou moins bien relevées.

Sans transition aucune, l'Université de Genève organise durant onze mois une exposition ponctuée d'une série d'événements sur les probabilités. Les animateurs du site RTSdécouverte.ch se sont associés à la démarche en réalisant, en collaboration avec des scientifiques de l'Université, un cahier pédagogique pour inviter le public à se frotter aux mathématiques sans perdre le sourire. : les jeux sont faits.

Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.

H. G. Wells

Addition (novembre 2012) : comment Fox News désinforme ses téléspectateurs (assez drôle).

Notes

[1] Il explique également pourquoi, lors d'une succession de tirages à pile ou face, les premières séquences pile-face-face et pile-face-pile n'apparaissent pas en même temps en moyenne.

[2] Non, rien.

[3] Peut-être que ce passage justifierait que l'entrée soit dans la catégorie Politique et pas Science.

jeudi 27 octobre 2011

Nanobrothers are watching you

À l'heure où l'orwellien 1Q84 de Murakami bat les records de ventes, il devient communément admis qu'il n'y a pas de Big Brother centralisé, mais qu'il existe plutôt une multitude de nanobrothers qui observent quotidiennement les us et coutumes de chacun.

Dans ce cadre, il est donc pertinent d'annoncer que le Radjaïdjah Blog va commencer à collecter certaines statistiques (location, pages visitées, etc) de ses visiteurs via piwik. Pour ne pas être pris en compte dans ces statistiques, une première chose à faire est de désactiver le javascript lors des visites. Facile.