Applicazioni di controllo vocale utilizzando l’architettura Freescale

Il controllo vocale dei sistemi elettronici non è una nuova invenzione; comunque il suo sviluppo è stato ostacolato da 10 anni dalla mancanza di un controller abbastanza potente e dedicato ai segnali digitali. Le cose sono cambiate nel frattempo, e con sufficienti fondi nel mercato per creare una richiesta per un'applicazione di controllo vocale, diversi produttori di semiconduttori hanno iniziato a soddisfare la domanda con soluzioni create grazie ai loro sforzi nella ricerca. Una di queste aziende è la Freescale e uno dei prodotti destinati ad essere il cuore delle applicazioni è il Core a 16-bit 56800E Digital Signal Controller Family (sviluppo software supportato dai CodeWarrior Development Tools).

Se desideri maggiori informazioni su questo prodotto Freescale, invia una richiesta ad Arrow utilizzando il seguente modulo.

Il controllo avanzato di un dispositivo con comandi vocali è ora possibile utilizzando un'architettura ibrida che combina un microcontrollore (MCU) con un elaboratore di suoni digitale (DSP). Le capacità di un'MCU ibrido consentono ai comandi vocali di integrarsi nei sistemi embedded. Praticamente ogni nuovo prodotto contenente un MCU ibrido può essere controllato dalla voce. Un sistema per il controllo di luci e riscaldamento può essere generalizzato per controllare ogni dispositivo con un set di comandi vocali. Gli algoritmi software possono essere sviluppati usando i modelli Markov.

La soluzione standard proposta da Freescale è concentrata nel DSP56F805, che provvede una memoria flash soddisfacente di 32K per implementare algoritmi di qualunque complessità sia richiesta. Altre caratteristiche che devono essere menzionate sono:

    -Oltre 40 MIPS ad una frequenza di core di 80MHz
    -Funzionalità del DSP e del MCU in un'architettura C-efficiente unificata
    -Cicli hardware DO e REP
    -Set di istruzioni MCU-friendly che supportano sia il DSP che le funzioni del controller: MAC, unità di manipolazione di bit, 14 modalità di indirizzamento
    -Memoria flash di programma di 31.5K parole di 16 bit (64KB)
    -Memoria Ram di programma di 512 parole di 16 bit (1KB)
    -Memoria flash dei dati di 4K parole di 16 bit (8KB)
    -Memoria Ram dei dati di 2K parole di 16 bit (4KB)
    -Memoria flash di boot di 2K parole di 16 bit (4KB)
    -Memoria esterna peri i Dati e per il Programma fino a 64K parole di 16 bit (128KB)
    -Due moduli PWM a 6 canali
    -Due ADC di 12 bit a 4 canali
    -Due decodificatori in quadratura
    -Modulo CAN 2.0 B
    -Due interfacce di comunicazione seriale (SCIs)
    -Interfaccia periferica seriale (SPI)
    -Fino a quattro Timers general purpose
    -Porta JTAG/OnCETM per il debugging
    -14 linee dedicate GPIO e 18 condivise
    -Contenitore LQFP a 144 pin

L'obbiettivo dichiarato è quello di fornire un progetto per un'architettura di riferimento per il controllo degli apparecchi domestici tramite comandi vocali. La subordinazione al parlante è uno dei principali aspetti da considerare quando si ha a che fare con il riconoscimento vocale; il sistema Freescale ha l'abilità di regolare finemente questa dipendenza, facendo in modo da rispondere solo a comandi preregistrati da un singolo utilizzatore (chi dovrebbe registrare il proprio modo di pronunciare parole come "light", "dark", "heat", "cold", nuemri, temperaturein un dato formato)
o da comandi vocali generali detti da ognuno in una stanza. La visione generale in un cliente di elettronica comunque, è che fare un sistema dipendente ha più vantaggi che svantaggi.

Come detto prima, il cuore del sistema è un SP56F805, intorno al quale gli altri componenti sono aggiunti in ordine per creare tutte le funzioni di un sistema di controllo da comandi vocali, interruttori manuali o keypad (in caso di un ambiente rumoroso). Ciascun microfono che è usato per la ricezione della voce ha un corrispondente interruttore ed una luce, che aumenta la necessità di un processo di arbitraggio (facilmente implementato via software).
Un diagramma a blocchi del sistema di riconoscimento vocale è disponibile sotto.

Il DSP campiona continuamente tutti gli ingressi del convertitore analogico-digitale (ADC), il processo software affiliato determina se c'è un "speech" negli input, e il DSP assegna il relativo dispositivo. L'ADC nel DSP56F805 ha due moduli, ciascuno multiplexato a 4 piedini; un totale di 8 sorgenti di segnale analogico.
Opzionalmente, un piedino dell' ADC può essere connesso ad un telefono attraverso una SLIC; un piedino è connesso al sensore della temperatura. I rimanenti 6 piedini possono essere connessi ai microfoni.

La risoluzione dell'ADC è di 12 bit, e la frequenza di campionamento massima è di 800 kHz, campionamento multiplexato in base al tempo di tutti e otto i canali dell'ADC. Per minimizzare la richiesta della memoria, è raccomandata una frequenza di campionamento di 8 kHz per
tutti i canali vocali. Come opzione aggiuntiva, il sistema di riscaldamento può essere controllato da un telefono. Il processo di riconoscimento è lo stesso. Se il discorso è riconosciuto, il DSP lo ritorna come un segnale audio per confermare la validità del riconoscimento.

Il DSP è connesso ad un telefono attraverso una SLIC. L' ADC interno è usato come input e un convertitore digitale-analogico (DAC) esterno è usato come stadio finale. Il DAC e il DSP sono connessi attraverso una interfaccia periferica seriale (SPI). Una delle caratteristiche peculiari della soluzione è la possibilità di cambiare in tempo reale i parametri usati per il riconoscimento vocale, attraverso le capacità fornite dall'SDK.

Come si può immaginare, un sistema di riconoscimento vocale (l' applicazione del controllo vocale è solo un particolare utilizzo del riconoscimento vocale) ha una componente software abbastanza complessa. Eseguire l'algoritmo del comando vocale è probabilmente la più difficile di queste operazioni. Questa è fatta principalmente utilizzando algoritmi basati su modelli nascosti Markov, che erano stati inizialmente sviluppati negli ultimi anni '60 e le applicazioni di riconoscimento dalla metà degli anni '70. Qui c'è un riassunto illustrato delle attività eseguite dalla componente software dell'applicazione:

Sebbene il progetto si riferisca in particolare al progetto per il controllo domestico, gli stessi principi generici potrebbero essere applicate ad ogni dispositivo che necessita di essere controllato in questo modo.

Freescale è uno dei produttori dedicati al settore automobilistico, e le caratteristiche di un veicolo controllato vocalmente sono le prossime promesse nella macchine di fascia alta.Solo per caso ho trovato la pubblicità di un' Audi, che non fa segreto sul potente sistema di controllo vocale che offre ai suoi clienti.

RICHIESTA DI CONTATTO
Se desideri maggiori informazioni su questo prodotto Freescale, invia una richiesta ad Arrow utilizzando il seguente modulo.

Scarica subito una copia gratis

Una risposta

  1. Avatar photo Emanuele 4 Dicembre 2009

Scrivi un commento

Seguici anche sul tuo Social Network preferito!

Send this to a friend