Sviluppo software e assistenza > GoJack OCR (riconoscimento ottico dei caratteri)

Scritto ANTI-CAPTCHA in php per GoJack :)

<< < (5/45) > >>

Daniele8787:

--- Citazione da: ccgiorg - Ottobre 09, 2012, 08:35:48 pm ---edit2:cmq... daniele tu che sai cm fare... per ovviare al problema dei captcha per fare il training... sarebbe possibile salvare il captcha col rispettivo codice ad ogni invio corretto in una cartella? così ne avresti sempre di nuovi da ogni utente per il training...

--- Termina citazione ---
Scusa, ho letto solo ora questo edit. Si ci avevo già pensato..prima o poi lo farò. E cosi creiamo una specie di sistema automatico che aggiorna le definizioni captcha...cosi come le definizioni anti virus. ;) ma siete favorevoli a farmi inviare sul server centrale, i captcha, ad ogni invio? un po rallenterebbe l'invio di ogni sms.

ccgiorg:
bha, servirebbe per migliorare l'intero sistema, quindi perchè essere sfavorevoli? :)sennò anzichè ad ogni invio potresti fare cm hai fatto con gli aggiornamenti... si salvano i captcha in una cartella e dopo un pò o contestualmente all'aggiornamento si inviano ... così di blocco... così, almeno in teoria io ho compreso così :P , nn si rallenta l'invio...

Daniele8787:
Novità: ho fatto delle modifiche che migliorano un po la lettura ed evitano alcuni errori di riconoscimento..e cosi abbiamo più probabilità di leggere bene il captcha. :) In pratica, prima nel training salvavo le lettere nel database se non c'era già una lettera con corrispondenza maggiore dell' 86%. Ma in effetti mi sono reso conto che la percentuale serve a poco..conta il risultato.
E allora ho fatto quello che avrei dovuto fare prima, e cioè inserire questa condizione: la so leggere? Allora la inserisco, Non la so leggere, la inserisco.
La cosa strana è che col metodo precedente della percentuale, rianalizzando le leggere anche dopo aver già scritto il database, le dimensioni di questo NON aumentavano..restavano sempre uguali..come era logico aspettarsi, visto che le lettere necessarie (probabilità > 86%) ci sono già tutte.

Bè, cosa strana, col metodo attuale invece, il database aumenta ad ogni allenamento (fino al terzo) E ad ogni allenamento aumenta sempre meno. Volendo spiegare la cosa, sembrerebbe che ci siano lettere che all'inizio del primo allenamento legge bene, e per cui le rifiuta, mentre poi salvando altre lettere si "confonde" e le probabilità si spostano su altre lettere. Ragion per cui al successivo training con le STESSE immagini, ha bisogno di salvarne altre, per ripristinare le corrette probabilità. Quindi ha bisogno di uno studio, e di un "ripasso" proprio come uno studente...che più studia e più ha bisogno di ripetere... :D

Daniele8787:
Forse ho trovato un modo per eliminare lo sfondo in modo più sicuro, senza spezzare le gambe alle lettere. :) Mi serve un po di tempo per implementarlo e vedere se funziona.

dongongo:
Sei eccezionale, non ho più parole! :o
Funziona anche su Frei-Simser!? 8)

Navigazione

[0] Indice dei post

[#] Pagina successiva

[*] Pagina precedente

Vai alla versione completa