Pour le moment le mot est sélectionné de façon équiprobable parmi tous les mots de la base (environ 130k).
Du coup on a bien trop souvent des mots peu ou pas connu...
Idée pour y rémédier : definir un niveau de difficulté d'un mot. Cellui serait par exemple
10 - log10 (nbhitgoogle + 10)
un mot a zero hit (!) aurait une difficulté de 10
un mot a 100 million de hit, aurait environ 2...
l'utilisateur à un niveau de competence... sur la mm echelle...
on tire sur une gaussienne centrée sur le niv de comp, la difficulté du mot a selectionner. On choisit via SQL plein de mot (1000 ?) et on ordonne par l'écart abs entre sa difficulté et la difficulté selectionnée... on prend le premiers.
On truc de ce style...
on ajuste le niveau de l'utilisateur à la hausse ou baisse en fonction de ses succès ou echec... a définir