Cuprins:
- Pasul 1: Materiale și fișiere necesare
- Pasul 2: Pasul 2: verificați fișierul Voicehat.py pentru mai multe informații
- Pasul 3: Pasul 3: Adăugați un cod de sunet declanșator la codul demonstrativ
- Pasul 4: Pasul 4: Rulați codul și asigurați-vă că totul este bine să mergeți
- Pasul 5: Pasul 5: Creați propriul fișier.wav
- Pasul 6: Pasul 6: Adăugarea sunetului de confirmare?
2025 Autor: John Day | [email protected]. Modificat ultima dată: 2025-01-13 06:58
Acest tutorial este destul de simplu. M-am bucurat cu adevărat de setul de voce Google AIY, dar îmi place foarte mult pe Google Home normal zgomotul pe care îl fac pentru a confirma că ascultă activ. Aceasta nu este configurată în mod implicit în niciunul dintre exemplele preîncărcate pe imaginea kitului vocal AIY.
Includ, de asemenea, un link către stocul Start și Confirmă zgomotele pe care le-am înregistrat de pe Google Home-ul propriu-zis cu înregistratorul Zoom.
Iată-ne, primul meu instructabil!
Pasul 1: Materiale și fișiere necesare
- Kit complet funcțional Google AIY Voice - pentru a vă configura kitul, accesați pagina oficială AIY Voice Kit.
- Abilitatea de a accesa terminalul Pi prin SSH, VNC sau cu un monitor și tastatură
- Fișier WAV pe care doriți să îl redați atunci când Pi ascultă intrarea vocală - Dacă nu utilizați fișier personalizat, descărcați aici fișierul standard „St art Talking” sau descărcați-l de pe linkul atașat.
- (Opțional) Editor audio care poate converti fișiere și le poate modifica bitul și rata de eșantionare
Pasul 2: Pasul 2: verificați fișierul Voicehat.py pentru mai multe informații
IMPORTANT
Nu folosesc cea mai recentă imagine din kitul meu vocal care include codul atât pentru kitul Voice, cât și pentru Vision (adică aiyprojects-2018-01-03.img). Folosesc codul din filiala Voice Kit care poate fi găsită pe Google AIY Raspbian GitHub. Părerea mea personală este să folosiți doar filiala kitului vocal pentru ao simplifica și nu trebuie să vă ocupați de codul Vision atunci când lucrați cu kitul dvs. vocal
Trecând peste…
Acest pas nu este total obligatoriu, dar vă va arăta unde a îngropat Google instrucțiunile pentru ca acest lucru să funcționeze dacă doriți să faceți acest lucru mai departe sau să înțelegeți de ce funcționează codul pe care îl adaug.
pi @ raspberry: cd AIY-voice-kit-python / src / aiy /
Apoi vom verifica fișierul voicehat.py din acel folder:
pi @ raspberry: ~ / AIY-voice-kit-python / src / aiy / sudo nano voicehat.py
Imaginea atașată arată unde puteți afla despre UI-urile de stare și cum să utilizați un sunet în timpul declanșatorului.
Bine, acum să adăugăm un cod la unul dintre fișierele de exemplu pentru a face acest lucru să funcționeze.
Pasul 3: Pasul 3: Adăugați un cod de sunet declanșator la codul demonstrativ
Mai întâi, navigați la folderul AIY-voice-kit-python și rulați codul sursă
cd AIY-voice-kit-python
sursa env / bin / activate
cd src
Apoi utilizați „sudo nano” fie în „assistant_grpc_demo.py”, fie în „assistant_library_demo.py”
Diferența dintre cele două fișiere este că assistant_grpc_demo.py folosește butonul pentru a declanșa Asistentul Google și assistant_library_demo.py folosește cuvântul de activare „Ok, Google” pentru a declanșa Asistentul Google.
Pentru ambele aceste fișiere trebuie să adăugați o singură linie de cod:
status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav')
Aceasta presupune că ați plasat sunetul de început în folderul / home / pi / și l-ați denumit googlestart.wav. Schimbați-le pe baza oricărui nume pe care l-ați numit și oriunde l-ați localizat.
Linia de cod pe care o căutăm este mai jos:
status_ui.status („ascultare”)
Vrem să adăugăm noua noastră linie de cod ÎNAINTE de acea linie de cod …
Pentru exemplul „assistant_library_demo.py”, acesta poate fi găsit aici:
elif event.type == EventType. ON_CONVERSATION_TURN_STARTED:
# Și acum adăugați codul nostru status_ui.set_trigger_sound_wave ('home / pi / googlestart.wav') status_ui.status ('ascultare')
Pentru exemplul „assistant_grpc_demo.py”, acesta poate fi găsit aici:
button.wait_for_press ()
# Și acum adăugați codul nostru status_ui.set_trigger_sound_wave ('/ home / pi / googlestart.wav') status_ui.status ('ascultare')
Aceasta presupune că ați plasat sunetul de început în folderul / home / pi / și l-ați denumit googlestart.wav. Schimbați-le pe baza oricărui nume pe care l-ați numit și oriunde l-ați localizat.
Apăsați CTRL-X și Y pentru a salva totul.
*** NOTĂ: Am găsit ceva cam prost. Pentru „assistant_library_demo.py” adăugarea sunetului de declanșare pare să nu facă nicio diferență în funcția de recunoaștere a vorbirii. Cu toate acestea, pentru „assistant_grpc_demo.py”, se pare că atunci când sunetul declanșatorului este implementat, acesta întrerupe primul sau doi cuvinte pe care le spuneți. Nu sunt sigur de ce. Încerc încă să-mi dau seama.
Pasul 4: Pasul 4: Rulați codul și asigurați-vă că totul este bine să mergeți
pi @ raspberry: cd AIY-voice-kit-python
și încărcați virtualenv
pi @ raspberry: ~ / AIY-voice-kit-python $ source env / bin / activate
și rulați-l!
(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_library_demo.py
sau
(env) pi @ raspberry: ~ / AIY-voice-kit-python $ src / assistant_grpc_demo.py
Acum spuneți „Bine, Google” sau apăsați butonul respectiv și vedeți dacă funcționează!
Pagina următoare vă va ajuta dacă aveți propriul fișier personalizat și ratele de biți și eșantionare corespunzătoare pentru fișierul dvs..wav
Pasul 5: Pasul 5: Creați propriul fișier.wav
Dacă nu sunteți interesat să utilizați fișierul meu.wav cu sunetul de pornire standard Google Home, va trebui să creați propriul fișier.wav. A fost nevoie de un pic de încercare și eroare pentru a obține bitul și rata de eșantionare corecte pentru mine.
Am folosit Logic Pro X pentru a face toată editarea (în imagine), care este un DAW complet pentru crearea și producerea de muzică. Două opțiuni pe care le-am găsit care ar putea fi potrivite sunt Switch sau MediaHuman Audio Converter. Presupun că ați putea face acest lucru cu Garageband dacă aveți un Mac, dar nu am încercat asta.
Există trei părți cheie ale fișierului dvs. care sunt necesare pentru ca acesta să funcționeze cu codul demonstrativ.
- Trebuie să fie un fișier audio MONO
- Rata de eșantionare trebuie să fie 32000
- Trebuie să fie un fișier.wav
- (Opțional) Rezoluția de 16 biți a funcționat cel mai bine pentru mine
Pasul 6: Pasul 6: Adăugarea sunetului de confirmare?
Aici sunt blocat dacă cineva are gânduri. Mi-ar plăcea să adaug zgomotul de confirmare dacă sistemul recunoaște intrarea vocală ca pe un Google Home normal.
Am atașat zgomotul de confirmare a stocului de mai jos pentru confortul dvs.
Bucurați-vă!