Cuprins:
2025 Autor: John Day | [email protected]. Modificat ultima dată: 2025-01-13 06:58
Prezentare generală
Actualizare: Demo video scurt:
PiTextReader permite cuiva cu deficiențe de vedere să „citească” text din plicuri, scrisori și alte articole. Face instantanee o imagine a elementului, se convertește în text simplu folosind OCR (Recunoaștere optică de caractere) și apoi vorbește textul folosind text-to-speech.
Reader-ul este conceput pentru a fi cât se poate de simplu de utilizat. Nu este nevoie de internet, nu există interfață grafică, doar un singur buton. Așezați doar elementul de citit pe suport și apăsați un buton. După câteva momente, textul le va fi citit înapoi.
Am conceput acest lucru pentru un părinte în vârstă cu probleme de vedere la ochi, cum ar fi degenerescența maculară, dar poate fi utilizat mai larg pentru oricine dorește textul tipărit tradus în vorbire audio.
Există mulți cititori disponibili, însă cei mai mulți costă mii de dolari sau sunt pentru cineva care are cunoștințe tehnice care necesită conectivitate la Internet și utilizarea unui telefon inteligent. Acest cititor este conceput pentru a fi complet independent, fără internet și fără interfață în afară de un buton mare.
Pro
- Un singur buton de controlat
- Nu este necesară conexiunea la internet
- Nu există interfață grafică pentru utilizator pentru a naviga
- Costul total este mai mic de 100 USD
- Întotdeauna gata de plecare
Contra
- OCR poate fi limitat datorită fonturilor, culorilor, dimensiunii textului etc.
- Vorbirea sună ca Stephen Hawking
- Funcționează cel mai bine pentru secțiuni mici de text negru pe hârtie albă.
Pasul 1: Hardware
- Raspberry Pi 3 (are nevoie de putere!)
- 8GB + card micro SD
- Alimentare de curent continuu 5v 2A pentru Raspberry
- Camera Raspberry Pi (obișnuită sau NoIR)
- Cablu pentru cameră Raspberry Pi de 24”https://www.adafruit.com/product/1731
- Suport pentru cameră sau carcasă https://www.adafruit.com/product/3253 sau
- Instrument de reglare a obiectivului (pentru focalizarea camerei)
- Difuzor mono alimentat prin USB (dimensiune mică preferată!)
- Buton mare - Momentaneu cu LED
- Rezistor de 330 ohmi pentru LED-ul butonului de mai sus
- Cutie de lemn de 8”x8” x2”de la Michaels sau de la alte magazine mari de artă.
- Resturi de lemn pentru construirea suportului camerei:
- Banda plată de 8”Lx1” Wx1 / 2”T
- 5 "Lx1" Wx1 / 4 "T benzi plate
- 6 "Lx1 / 2" x1 / 2 "diblă pătrată pentru un ghid de plasare
- Șuruburi, lipici, sârmă, lipit etc.
Pasul 2: Construcția hardware
Folosind caseta de 8”x8”:
1. Găuriți gaura din spate pentru cablul de alimentare.
2. Găuriți în colțul din dreapta față pentru butonul momentan3. Gaură (găuri) pentru difuzor. (a se vedea pasul audio 12 de mai jos)
4. Am folosit o bucată de bandă de aluminiu de 2”x1 / 4” x13”pentru montarea camerei, dar și benzile de lemn funcționează.
A. Montați banda de lemn plat de 8”pe spatele capacului cutiei. (asigurați-vă că este atașat la capac și nu la partea de jos a cutiei, altfel nu veți putea să-l deschideți!)
b. Montați banda de lemn plană de 5”pe verticala de 8” cu șuruburi și lipici. Rețineți că înălțimea camerei determină dimensiunea documentului și focalizarea necesară. Poate doriți să mergeți mai sus pentru documentele cu suprafață mai mare.
5. Tăiați o fantă de 1 "x1 / 16" în partea superioară a cutiei, lângă verticala de 8 ", pentru ca cablul camerei să treacă.
NOTĂ: În ceea ce privește componentele electronice, vă sugerez să NU montați încă componentele în mod permanent, astfel încât să puteți face cu ușurință reglaje.
6. Conectați cablul camerei de 24”la cameră. NU CONECTAȚI-VĂ încă la Zmeură.
Pasul 3: Continut hardware …
7. Montați camera cu fața în jos de la capătul benzii de lemn de 5”. Vă sugerez să așteptați înainte de a plasa camera în carcasă, astfel încât să puteți focaliza mai ușor obiectivul după ce alergați!
Pentru focalizarea inițială, utilizați instrumentul de reglare și rotiți obiectivul în sens invers acelor de ceasornic 1/4! întoarce.
8. Rulați cablul camerei în jos prin slot, apoi atașați-l la Pi. (Asigurați-vă că Pi este OFF!)
9. Instalați butonul momentan și conectați firele între acesta și pinii GPIO Pi 24 și GND. Și conectați LED-ul butonului printr-un rezistor de 220 ohmi la pinii GPIO Pi 18 și GND.
10. Rulați sursa de alimentare în cutie și conectați-o la Pi. Trebuie să utilizați un dispozitiv de reducere a tensiunii, cum ar fi lipici topit sau altele similare, pentru a conecta orificiul din cutie, astfel încât cablul să nu poată fi extras.
Pasul 4: Instalare hardware audio …
11. Pentru audio, am folosit un difuzor mono care folosea alimentare USB și audio mini jack. Am scos electronica și difuzorul din carcasa originală din plastic și am conectat mufa audio la mufa audio Pi și cablul USB la Pi USB. De asemenea, am înlocuit difuzorul mic original cu unul mai mare de 3”pentru o calitate a sunetului mult mai bună.
De când am montat difuzorul sub capacul cutiei, am forat mai multe găuri mici în formă de grătar pentru difuzoare.
12. În cele din urmă, verificați conexiunile, în special cablul camerei și conexiunile GPIO.
NU PORNIȚI ÎNCĂ PI. Continuați mai întâi cu configurarea software-ului …
Nu există comutator On / Off, deoarece se presupune că Pi ar trebui să ruleze tot timpul, astfel încât să fie gata să citească ceva imediat. Folosește doar câțiva wați și poate rula 24/7 fără probleme.
Este posibil ca cardul SD să fie deteriorat dacă este deconectat sau este întrerupt, dar este rar. Încă nu am avut niciodată un card SD care nu poate fi pornit. Dar nu conectați la o bandă de alimentare care este oprită / pornită în mod regulat.
Pasul 5: Configurarea și configurarea sistemului de operare
Formatați un card microSD de 8 GB sau mai mare cu Raspbian Jessie (sau Stretch) Lite (fără GUI pentru acest proiect).
www.raspberrypi.org/downloads/raspbian/
Va trebui să accesați Raspberry de la distanță prin SSH. Pe Windows, puteți utiliza programul terminal PUTTY SSH. Pe Mac, trebuie doar să afișați o fereastră de terminal de comandă. Alternativ, puteți conecta temporar o tastatură și un monitor HDMI doar pentru a le construi, dar SSH face mai ușor să lucrați mai târziu.
Știați? Dacă instalați Raspbian Jessie pe un card SD utilizând un PC Windows, puteți crea două fișiere pe card pentru a configura accesul WiFi și SSH înainte de al porni pe un Raspberry?
Pentru aceasta, presupuneți că cardul dvs. SD este montat în prezent ca K: pe computer:
1) Instalați cea mai recentă imagine Raspbian Jessie pe SD. Pentru acest proiect, Jessie Lite ar trebui să funcționeze.
2) Cu notepad, creați un fișier numit doar „ssh” și utilizați Salvare ca „Toate fișierele” în K: / ssh Fișierul poate conține orice. Numele fișierului este important. NU trebuie să fie „ssh.txt” !!!
3) Cu notepad, creați un fișier numit „wpa_supplicant.conf” cu următoarele:
ctrl_interface = DIR = / var / run / wpa_supplicant GROUP = netdevupdate_config = 1
rețea = {
ssid = "mySSID" psk = "mypassword" key_mgmt = WPA-PSK}
Utilizați Salvare ca „Toate fișierele” în K: / wpa_supplicant.confAgain, nu lăsați Notepad să-l schimbe în „wpa_supplicant.conf.txt” !!
Când porniți Raspberry prima dată, Jessie le va căuta și se va conecta la Wifi. Totuși, va trebui să căutați pe router-ul dvs. adresa IP, deoarece acesta este atribuit automat folosind DHCP.
Acum gata de instalare pe Pi:
1. Introduceți cardul microSD în Pi și conectați-l la curent.
2. Pentru a vă conecta de la distanță la Raspberry Pi, va trebui să găsiți adresa IP a acestuia. Poti incerca:
$ ssh [email protected]
Sau de la Putty, introduceți numele gazdei: [email protected]
În caz contrar, va trebui să vedeți dacă routerul dvs. va afișa adresele IP ale dispozitivelor dvs. locale.
Odată conectat ca utilizator pi:
3. Actualizați sistemul de operare Raspbian:
$ sudo apt actualizare
$ sudo apt upgrade
4. Configurați Raspberry și activați camera:
$ sudo raspi-config
A. Schimbați parola de utilizator
b. Opțiuni de interfață -> Cameră foto -> Activare
c. finalizarea
d. Reporniți
Pasul 6: Instalarea aplicației software
Acum conectați-vă din nou la Pi și sunteți gata să instalați aplicația PiTextReader.
1. Instalați software-ul inițial necesar: $ sudo apt install git –y
2. Descărcați software-ul:
$ cd / home / pi
$ git clone
$ cd PiTextReader
$ sh install.sh
Puteți rula din nou instalarea în siguranță de mai multe ori, dacă este necesar.
3. Plasați un document simplu pentru a fi citit și rulați programul de testare care setează volumul, redă un sunet text-to-speech și face o fotografie.
$ sh test.sh
Dacă primiți mesaje de eroare, verificați Depanarea de mai jos. Editați programul test.sh pentru a regla volumul, dacă este necesar.
4. Programul de testare salvează o fotografie în „test.jpg”. Va trebui să copiați această imagine pe un computer, astfel încât să puteți vedea focalizarea și câmpul vizual. Un mod rapid și murdar de a face acest lucru este să porniți un mic server web pe Pi și să utilizați un browser:
$ python -m SimpleHTTPServer 8080 &
Apoi navigați la https:// {IPaddress}: 8080 /
Faceți clic pe test.jpg
Utilizați instrumentul de ajustare a obiectivului pentru a focaliza camera.
Rulați din nou programul test.sh de câte ori este necesar.
NOTĂ: dacă trebuie să reglați setările camerei raspistill, va trebui să editați și programul pitextreader.py cu noile setări.
CAMERA = "raspistill -cfx 128: 128 --awb auto -rot 90 -t 500 -o /tmp/image.jpg"
5. $ sudo reboot
Pi ar trebui să vină și să ruleze automat, gata de funcționare.
Pasul 7: Operațiune
Când porniți Pi, veți auzi un „OK Ready” și veți vedea LED-ul butonului aprins.
Ori de câte ori LED-ul este aprins, unitatea este gata de funcționare.
Puneți niște text tipărit sub cameră, de preferință doar câteva rânduri de text negru pe hârtie albă.
Rețineți că camera nu are nevoie de multă lumină, în special de NoIR. Lumina ambientală a camerei era în regulă pentru mine. Prea multă lumină provoacă o iluminare neuniformă și distorsionează OCR.
Apasa butonul.
LED-ul ar trebui să se aprindă și să sune un clic al camerei, precum și vocea „OK de lucru”.
După câteva secunde, textul ar trebui citit. Dacă textul este distorsionat, fontul este prea întunecat sau prea luminos, lateral sau cu susul în jos, atunci rezultatul va fi o vorbă goblenă!
Poate dura între 5-30 de secunde pentru a converti și a începe citirea, deci aveți răbdare. Cu cât este mai mult text, cu atât durează mai mult.
Dacă trebuie să opriți citirea, puteți apăsa butonul în timp ce sunetul este în continuare redat (LED-ul este stins).
După finalizarea discursului, după câteva secunde, LED-ul se aprinde și veți auzi din nou „OK Ready”. Este gata să efectueze o altă scanare.
Rețineți că distanța camerei este setată pentru camera Raspi și doar pentru o porțiune din documentul 8x10. Am găsit că cel mai bine este să citesc părți ale unui document la un moment dat, deoarece paginile întregi pot fi greu de ascultat. Multe dintre lucrurile care trebuie citite sunt text mai mic, deci dacă camera este prea departe, nu se poate rezolva.
Pentru a depana, verificați mai jos, în special secțiunea SCANARE ȘI OCR
Dacă totul este bine, montați permanent toate componentele pentru a finaliza construcția.
Pasul 8: Depanare
1. CAMERA
Verificați dacă camera este activată prin
$ sudo raspi-config
Opțiuni de interfață -> Cameră foto
Puneți din nou cablul panglică întrucât este delicat și trebuie să fie exact aliniat. Dacă este necesar, google „depanare cameră raspberry pi” pentru a căuta probleme similare. De asemenea, Google mesajul de eroare pe care îl primiți atunci când rulați programul test.sh.
2. AUDIO
Aveți volum crescut?
$ sudo amixer -q sset PCM, 0 100%
Rulați testul audio
$ aplay /usr/share/sounds/alsa/Front_Center.wav
Niciun sunet încă? Forțează ieșirea audio a mufei:
$ sudo raspi-config Opțiuni avansate -> Audio -> Forțează mufa pentru căști
3. DISCURS
Dacă sunetul de mai sus sună bine, atunci încercați:
$ flite -t TEST
Mesaje de eroare Google, dacă există.
Executați din nou install.sh
Da, discursul sună cam ca Stephen Hawking.
4. SCANARE ȘI OCR
Aceasta este cea mai mare zonă de reglare necesară. Pentru ca OCR să funcționeze corect, imaginea camerei trebuie să fie de bună calitate; documentul trebuie să fie luminat fără probleme, însă nu neapărat puternic.
Textul trebuie să fie plat și clar. Nu toate fonturile sunt lizibile.
Pentru a verifica calitatea, examinați cele două fișiere:
/tmp/text.txt și /tmp/image.jpg
Puteți porni micul server web și puteți utiliza un browser:
$ cd / tmp $ python -m SimpleHTTPServer 8080 &
Textul din imagine trebuie să fie simplu și lizibil. Imaginea ar trebui să fie dreaptă în sus, cu contrast bun, să fie focalizată. Poate fi necesar să întoarceți documentul dacă este cu capul în jos. (reamintiți-i utilizatorului că, dacă aude gobbly-gook, încercați să întoarceți documentul.) Dacă imaginea are un contrast slab, va trebui să îmbunătățiți iluminarea, prea mult sau prea puțin poate provoca probleme. Iluminarea neuniformă va provoca, de asemenea, eșecul părților din text. Puteți găsi mai mult ajutor accesând Google „tesseract-ocr help”
5. MONITOR HDMI / TASTATURĂ
Da, puteți conecta o tastatură și un monitor la Pi, în special. dacă nu găsiți adresa IP sau nu puteți accesa prin SSH. Nu există o interfață GUI și acest lucru poate dezactiva sunetul, cu excepția cazului în care monitorul dvs. are difuzor.
6. INTERNET / WIFI
Dacă WIFI nu funcționează, puteți doar să conectați temporar un cablu Ethernet și să îl utilizați.
Acest proiect nu are nevoie de Internet sau WiFi după ce ați finalizat instalarea și configurarea.