Novità: ho fatto delle modifiche che migliorano un po la lettura ed evitano alcuni errori di riconoscimento..e cosi abbiamo più probabilità di leggere bene il captcha.
In pratica, prima nel training salvavo le lettere nel database se non c'era già una lettera con corrispondenza maggiore dell' 86%. Ma in effetti mi sono reso conto che la percentuale serve a poco..conta il risultato.
E allora ho fatto quello che avrei dovuto fare prima, e cioè inserire questa condizione: la so leggere? Allora la inserisco, Non la so leggere, la inserisco.
La cosa strana è che col metodo precedente della percentuale, rianalizzando le leggere anche dopo aver già scritto il database, le dimensioni di questo NON aumentavano..restavano sempre uguali..come era logico aspettarsi, visto che le lettere necessarie (probabilità > 86%) ci sono già tutte.
Bè, cosa strana, col metodo attuale invece, il database aumenta ad ogni allenamento (fino al terzo) E ad ogni allenamento aumenta sempre meno. Volendo spiegare la cosa, sembrerebbe che ci siano lettere che all'inizio del primo allenamento legge bene, e per cui le rifiuta, mentre poi salvando altre lettere si "confonde" e le probabilità si spostano su altre lettere. Ragion per cui al successivo training con le STESSE immagini, ha bisogno di salvarne altre, per ripristinare le corrette probabilità. Quindi ha bisogno di uno studio, e di un "ripasso" proprio come uno studente...che più studia e più ha bisogno di ripetere...