Google ha aperto le API per l'OCR
Servizi Web / / December 24, 2019
Sì, lavorano in Google Libri portare sicuramente dei buoni risultati, possiamo cominciare a raccogliere. E ora vi dirò come.
I documenti acquisiti non sempre richiedono una trasformazione del testo vero e proprio. Ma a volte che vuole, non guadagnare ancora alcun accordo, e una copia elettronica di qualcosa e non. Naturalmente, si potrebbe usare qualche programma a basso costo l'OCR, andando con lo scanner, o anche acquistarlo (non rubare voi) FineReader. Ma il software desktop OCR gratuito gestisce anche perché ora i testi sono sempre più fotografati, non sottoposto a scansione.
Per scaricare tutte le immagini (jpeg, png, gif), con il riconoscimento del testo per la successiva API di Google e ha aperto in Google Documenti. Ora è possibile caricare le immagini in una raccolta documenti, e il server di Google lo trasformerà in testo.
V'è anche un esempio di applicazione che illustra come l'API:
Ma voi, i programmatori dovrebbero pensare di creare la propria interfaccia a queste funzionalità. Per esempio - avete le scansioni di libri in PNG? Si tratta di una perversione, non è vero? Così ci avete la scheda in mano - scrivere un'applicazione che carica la pagina di testo per pagina, non viola i limiti e si collega l'intero carico in un unico testo.
Ma ricordate, ci sono limitazioni nella API, e il principale di essi, mi sembra - qualcosa che è riconosciuto Latina solo appena. Inoltre si deve fare attenzione ad altezza carattere non è inferiore a 10 pixel, e la dimensione totale dell'immagine non superi 10 megapixel.