Iza naziva AlfaNum krije se grupa projekata u oblasti automatskog prepoznavanja govora (engl. Automatic Speech Recognition - ASR), identifikacije i verifikacije govornika, kao i automatske sinteze govora na osnovu teksta (engl. Text-to-Speech - TTS) na srpskom jeziku. Reč je o multidisciplinarnim problemima za čije su rešavanje potrebna znanja iz brojnih oblasti, počev od akustike, fonetike i lingvistike, pa do matematike, telekomunikacija, obrade signala i programiranja, a poseban problem predstavlja činjenica da je reč o problemima u velikoj meri zavisnim od jezika. Oko projekta AlfaNum okupljena je grupa nastavnika i saradnika Katedre za telekomunikacije i obradu signala, Fakulteta tehničkih nauka u Novom Sadu. Na čelu tima nalazi se profesor dr Vlado Delić, a tim se sastoji od desetak aktivnih i još toliko povremenih saradnika. S obzirom da je projekat vremenom okupio toliko saradnika da ih nije bilo moguće sve uključiti u nastavu na Fakultetu kao asistente, 2003. je osnovano preduzeće "AlfaNum d.o.o." u kom su zaposleni svi oni koji nisu bili u mogućnosti da rade na Fakultetu.Pozivamo vas da posetite i Web stranu preduzeća "AlfaNum d.o.o.", na kojoj, između ostalog, možete naći i demonstraciju nekih naših dostignuća. Kao naučnoistraživački tim sa izuzetnim rezultatima, AlfaNum je i jedan od članova Centra za vibroakustičke sisteme i obradu signala (CEVAS), prvog centra izuzetnih vrednosti na Fakultetu, koji je trenutno u proceduri akreditacije kod Ministarstva prosvete, nauke i tehnološkog razvoja.

Prepoznavanje i sinteza govora već odavno ne zahtevaju poseban hardver. Personalni računari i mobilni telefoni postali su dovoljno brzi, pouzdani i jeftini. Međutim, naše tržište je veoma ograničeno i zatvoreno, a specifičnosti srpskog jezika su brojne. Zbog toga smo se odlučili da sami krenemo u razvoj govornih tehnologija na našem jeziku. Više o rezultatima naših istraživanja možete naći ovde.

Sve aplikacije računarske telefonije (engl. Computer Telephony Integration - CTI) koje uključuju ASR ili TTS na srpskom jeziku naše su delo. Danas širom Srbije, kao i drugih republika bivše Jugoslavije, postoji na stotine telefonskih linija na čijim se krajevima nalaze računari koji primaju telefonske pozive i pružaju pozivaocima tražene informacije ili usluge kroz govornu komunikaciju na srpskom jeziku.

Kroz istraživanje i razvoj softvera za prepoznavanje i sintezu govora, razvili smo odgovarajuće audio-vizuelne alate, kao i softversko okruženje za razvoj i testiranje CTI aplikacija. Snimili smo i obradili brojne govorne baze na srpskom jeziku, namenjene kako prepoznavanju tako i sintezi govora. Inicirali smo i više projekata humanitarnog karaktera, čiji je cilj širenje računarske pismenosti među slepima i slabovidima, omogućeno tek pojavom kvalitetne sinteze govora na srpskom jeziku.

Govor predstavlja osnovni način komunikacije među ljudima. Govorom čovek prenosi svoje misli i osećanja drugim ljudima na daleko složeniji način nego što to čini ijedna druga životinjska vrsta, pa je zato i njegov vokalni aparat najsloženiji i obuhvata mnoge organe, počev od pluća, preko dušnika, grkljana i glasnih žica, do usne šupljine sa jezikom, zubima i usnama, i nosne šupljine.

Govor, posmatran kao zvučni signal, nosi u sebi mnoštvo informacija. Osim onoga što je rečeno, u njemu su sadržane i informacije o govorniku, na osnovu kojih možemo da odredimo emotivno stanje govornika, da poznatog govornika prepoznamo, a nepoznatom odredimo pol i starost. Shvatamo smisao, uočavamo dijalekt, nivo obrazovanja i kulturu govornika.

Pri razumevanju šta je rečeno čovek koristi svoje poznavanje jezika i razumevanje konteksta. Dakle, razdvajanje sekvence glasova koje čujemo na niz reči moguće je samo na poznatom jeziku. Percepcija govora nije stoga čisto auditorni proces, odnosno, leksička segmentacija nije urođena već naučena sposobnost. Pri svemu tome, čovek je u stanju da se usredsredi na jednog u mnoštvu govornika, da oceni odakle glas dolazi, a često i da razume ono što nije rečeno ali se podrazumeva.

   

Automatsko prepoznavanje govora (ASR) spada u najveće tehničke izazove savremenog doba i već više od pola veka zaokuplja pažnju istraživača širom sveta. Zadatak automatskog prepoznavanja govora je da na osnovu ulaznih podataka u vidu zvučnog zapisa neke govorne celine (reči ili rečenice) da izlaz u vidu tekstualnog zapisa. Na taj način se govor praktično konvertuje u tekst, odnosno, "prepoznaje se" šta je određeni govornik izgovorio.

Automatsko prepoznavanje govora realizuje se tako što se iz zvučnog zapisa izdvajaju određena obeležja govornog signala, koja se zatim porede sa unapred pripremljenim referentnim uzorcima ili modelima. Već tu se postavlja niz pitanja: koja su to obeležja relevantna za prepoznavanje govora, kako se ona mogu izdvojiti iz govornog signala, kako se zatim pripremaju referentni uzorci odnosno modeli, kako se vrši poređenje obeležja govorne celine koju treba prepoznati sa referentnim modelima odnosno uzorcima. Poseban problem predstavlja velika varijabilnost govora, jer ne izgovaraju dve osobe istu reč na isti način, niti je jedna ista osoba izgovara uvek na isti način. Iz tih razloga se za prepoznavanje govora koriste sistemi zasnovani na tzv. skrivenim Markovljevim modelima (HMM) i/ili veštačkim neuronskim mrežama.

Automatsko prepoznavanje govora (ASR) odvija se u dve faze: obučavanje (off-line) i prepoznavanje (on-line). Obučavanje se vrši pomoću odgovarajućih baza govornih uzoraka. Ako ASR sistem mora posebno da se obučava za prepoznavanje datog govornika, reč je o prepoznavanju zavisnom od govornika. Ako, međutim, može uspešno da prepoznaje veliki broj govornika čiji glasovi nisu korišćeni u fazi obučavanja, reč je o prepoznavanju nezavisnom od govornika.

Razlikujemo ASR sisteme koji prepoznaju izolovane reči od sistema koji mogu da prepoznaju i povezano izgovorene reči. U oba slučaja reči moraju biti iz unapred definisanog skupa koji nazivamo rečnikom. Veličina rečnika utiče na tačnost prepoznavanja - što je rečnik širi, verovatnoća greške je veća. Poseban problem javlja se u slučaju da u rečniku postoje reči koje se slično izgovaraju, ali ovo se pri kreiranju aplikacije najčešće može izbeći.

   
Sinteza govora na osnovu teksta (TTS) je najstarija govorna tehnologija čiji počeci sežu još u 18. vek, kada su se pojavile prve "mašine koje govore". U međuvremenu je u toj oblasti došlo do dramatičnog razvoja, u najvećoj meri zahvaljujući razvoju računarske tehnologije u poslednjih nekoliko decenija. Ovo je govorna tehnologija kod koje u najvećoj meri dolazi do izražaja zavisnost od jezika, tako da je sintetizator govora za svaki novi jezik potrebno realizovati praktično iz početka, a eventualne adaptacije su moguće samo za izuzetno slične jezike.

Zadatak sinteze govora je da na osnovu ulazne informacije u tekstualnom obliku generiše govorni signal razumljiv čoveku. To podrazumeva i da bi sintetizovan govor morao da zvuči prirodno, odnosno, da bi trebalo da poseduje intonaciju karakterističnu za prirodan ljudski govor. Prirodnost sintetizovanog govora nije samo stvar estetike, već je bitan element za razumevanje poruke, pošto pomaže slušaocu da rastavi govorni tok na reči.

Da bi sintetizovani govor zvučao prirodno, TTS sistem bi morao raspolagati informacijama o željenoj intonaciji, kao i o nizu fonema koje je potrebno izgovoriti. Jedan od najvećih problema sinteze govora na osnovu teksta jeste što te informacije nisu eksplicitno date u tekstu, već ih je potrebno na neki način odrediti. Sintetizatori govora na jezicima sa relativno slobodnim akcentom, u koje spada i srpski, moraju se u tome osloniti na obimne akcenatsko-morfološke rečnike, kao i module za sintaksnu analizu rečenice.

Samo generisanje govornog signala može se obaviti na više načina, ali je u današnje vreme zbog velike procesorske snage i memorijskih kapaciteta savremenih računara, kao i svoje jednostavnosti, najpopularniji pristup povezivanjem najpogodnijih segmenata unapred snimljenog govora, odabranih u toku same sinteze. Pri ovome treba odgovoriti na pitanja kako odabrati odgovarajuće segmente iz govorne baze koja može da sadrži i na desetine hiljada reči, kolika treba da bude veličina tih segmenata, kako ih obraditi tako da se njihova akustička svojstva podudare sa zahtevanim, kao i da se prelazi na granicama između segmenata što manje čuju. Na ova pitanja odgovore daju brojne tehnike sinteze govornog signala, među kojima su najznačajnije TD-PSOLA metod u vremenskom domenu, kao i H/N metod hibridne sinteze govora u frekvencijskom domenu.

Kada je reč o primeni govornih tehnologija, treba imati na umu sledeće činjenice:

• Sve češće ćemo imati priliku da pričamo sa računarima i uređajima u svom okruženju, i ako to ne budemo mogli na svom maternjem jeziku, biće to veliki problem.
• Šira primena govorne komunikacije čovek-mašina moguća je isključivo na jezicima za koje su razvijeni automatsko prepoznavanje i sinteza govora. Evropska unija, shodno tome, ima potrebu za multijezičkim proizvodima i uslugama.
• Zavisnost govornih tehnologija od jezika je izuzetna, tako da se rešenja realizovana za jedan jezik u opštem slučaju ne mogu primeniti na druge jezike. Eventualna adaptacija je moguća samo u slučajevima da se radi o veoma srodnim jezicima.
• Naše tržište je relativno ograničeno i zatvoreno, tako
da je nerealno očekivati da se neka od većih stranih firmi koja se bavi govornim tehnologijama pozabavi rešavanjem problema srpskog jezika. U tom smislu, projekat AlfaNum ujedno predstavlja i podstrek očuvanju srpskog jezika.
• PC računari Pentium klase danas su dovoljno brzi tako da nije potreban skupi dodatni hardver, već čitavo rešenje može biti isključivo softversko i jedan računar može istovremeno da obavlja više razgovora sa različitim sagovornicima.
• U okviru projekta AlfaNum razvijena su kvalitetna rešenja za automatsko prepoznavanje i sintezu govora za srpski jezik, koja su već u širokoj primeni.

 

Pomoć slepim i slabovidim osobama u korišćenju računara predstavlja jednu od najznačajnih primena sinteze govora. Da bi slepa osoba mogla da se služi računarom i koristi određene programe gotovo podjednako efikasno kao i osoba normalnog vida, potrebno je da je računar u svakom trenutku obaveštava o sadržaju ekrana, za šta su potrebne dve softverske komponente. Jedna je tzv. "čitač ekrana", aplikacija koja na osnovu svake, pa i najmanje akcije korisnika sastavlja kratko obaveštenje o tome šta je pritisnuto, šta je pokrenuto i slično. Druga komponenta je sintetizator govora, koji će to obaveštenje konvertovati u govor razumljiv korisniku, tako da će on moći uz minimalno kašnjenje da radi na računaru kao i osoba normalnog vida. Na ovaj način se slepima omogućuje ravnopravnost u pristupu informacijama i pisanoj komunikaciji, što im otvara mogućnost za obavljanje raznih poslova, i daje im određenu samostalnost i podiže kvalitet njihovog života.
Izdavanje komandi glasom je još jedna od široko rasprostranjenih primena prepoznavanja govora. Ovde se po pravilu koriste sistemi za prepoznavanje govora zavisni od govornika, koji samim tim postižu i nešto višu tačnost prepoznavanja. Kod njih je potrebno da se sistem prethodno obuči na određenog govornika, što znači da govornik mora naglas da pročita određeni tekst. Nakon toga sistem uspešno prepoznaje komande koje govornik izdaje. Ova mogućnost često se koristi za iniciranje poziva u mobilnoj telefoniji, kao i za upravljanje tehnološkim procesima, uređajima u domacinstvu, pa i u aplikacijama edukativnog i zabavnog karaktera. Odgovarajući sistemi za prepoznavanje govora koriste se i za uspostavljanje i prosleđivanje telefonske veze u javnim i privatnim telefonskim mrežama, ali se kod njih, naravno, radi o prepoznavanju govora nezavisnom od govornika.

Najpopularnija komercijalna primena govornih tehnologija je u okviru govornih automata, koji po pravilu u sebi objedinjuju obe najznačajnije govorne tehnologije - prepoznavanje i sintezu govora.

Govorni automati predstavljaju aplikacije računarske telefonije koje omogućuju korisnicima da bez učešća operatera (osim kada to sami zatraže) pristupe velikoj količini informacija preko običnog telefona, kao i da istim putem iniciraju određene radnje, kao što su vršenje rezervacija, pokretanje i kontrola transakcija i slično. Prepoznavanje govora omogućuje pozivaocima da stupe u intuitivnu i efikasnu komunikaciju sa govornim automatom, u kojoj odmah mogu da kažu šta im je tačno potrebno, umesto da se kreću kroz složene strukture menija pomoću telefonske tastature. U nastavku su date ideje za primenu govornih automata.

Pozivni centri
Servis govorne pošte

Automatski telefonski operater
Objedinjeni sistem poruka
Fax na zahtev
Servis praćenja
Praćenje radnog vremena
Obezbeđenje i kontrola pristupa objektima
9x servisi
98x servisi
9xxx servisi
Poziv na račun pozvane strane
Telefonoteke
Kataloška prodaja
Stanje na putevima
Tehnička podrška
Marketing
Popunjavanje formulara
Anketiranje
Izbori
Vanredne situacije
Mobilizacija
Banke

Zdravstvo
Elektrodistribucije
Komunalne organizacije
Aerodromi
Autobuske i železničke stanice
Veleprodajni magacini
Servisi za popravku automobila
Fakulteti
Škole
Radio i TV program
Provajderi kablovske televizije
Provajderi mobilne telefonije
Pozorišta, bioskopi, koncertne dvorane…
Turističke agencije
Hoteli
Lokator objekata
Umetničke galerije i privatni dileri
Agencije za trgovinu nekretninama
Osiguravajuća društva
Kladionice
Horoskop
Zabavni sadržaji
Govorni Web

Pozivni centri predstavljaju efikasan način da preduzeća koja to žele ostvare potpuni multimedijalni kontakt sa svojim klijentima. Danas se u poslovanje pozivnih centara uključuju i email i Web komunikacija, tehnologije inteligentnog mrežnog rutiranja i savremene CTI tehnologije. Govorni automati u okviru pozivnog centra mogu samostalno da opsluže značajan procenat pozivalaca i time drastično rasterete operatere, uštede im vreme, i omoguće im da opsluže sve pozivaoce čak i u intervalima povećanog broja poziva. Preko pozivnih centara uspostavlja se prvi kontakt – stvara se prvi utisak, a danas, sa integracijom poslovnih transakcija u okvire pozivnih centara, sve veći deo poslovanja se i završava preko njih. Tako se stvara sveobuhvatan interfejs preduzeća ka okruženju, ali se i komunikacije unutar preduzeća podižu na jedan novi, kvalitativno viši nivo.
Servis govorne pošte (engl. Voice Mail) omogućuje automatski prijem govornih poruka, njihovo daljinsko preslušavanje, brisanje, promenu pozdravnih poruka i sl. Svakom pojedincu dodeljuje se posebno govorno poštansko sanduče, koje on može preslušati bilo da se nalazi u firmi ili izvan nje (ako sistem omogućava pristup sa udaljenog mesta). Prednost zajedničkog sistema govornih poruka jeste daleko niža cena od niza pojedinačnih telefonskih sekretarica, kao i dostupnost servisa u vreme kada je traženi lokal, odnosno njegova linija, zauzeta. Osim toga, sistem govorne pošte omogućuje pristup porukama preko monitora računara, prosleđivanje govorne poruke, i istovremeno slanje govorne poruke do većeg broja primalaca. Pojedini sistemi mogu, po prijemu poruke u mailbox, automatski da iniciraju poziv na programirani telefonski broj i da reprodukuju novosnimljenu poruku. Neki sistemi podržavaju i servis automatskog pozivanja broja sa kojeg je primljen poslednji poziv (engl. Auto Call Back).
Automatski telefonski operater (engl. Automated Attendant) prihvata poziv i prosleđuje ga na odgovarajući lokal. Ovakav sistem može potpuno da zameni više ljudskih operatera ili da im pomogne u intervalima povećanog broja poziva. Može podjednako da funkcioniše i van radnog vremena, noću i preko vikenda, a može da predloži pozivaocu da ostavi govornu poruku ako se na biranom lokalu niko ne javlja. Ovakvi CTI sistemi donose ogromne uštede velikim preduzećima.
Objedinjeni sistem poruka (engl. Unified Messaging) predstavlja zanimljiv servis za korisnike koji primaju veći broj poruka različitog tipa: e-mail, govorne i fax poruke. Ako za pristup tim porukama koristi različite sisteme, korisnik mora posebno da na računaru proverava da li ima e-mail poruka, preko telefona da li ima govornih poruka, fax uređaj ili odeljenje za prijem pošte da li ima fax poruka. Sistem objedinjenih poruka povezuje ove lokalne servise u jednu celinu, pružajući zajednički grafički korisnički interfejs (GUI). Ovakav sistem pruža i mogućnost pristupa sa udaljenih mesta jer je omogućena konverzija jednog tipa poruke u drugi. Na primer, TTS može da konvertuje email poruku u govornu, a ona se može preslušati preko telefona. Fax poruke se mogu konvertovati u tekst pomoću optičkog prepoznavanja karaktera (OCR) i potom konvertovati u govornu poruku na isti način.
Fax na zahtev (engl. Fax on Demand) koristi se za slanje detaljnijih informacija na zahtev pozivaoca. Naime, pozivaocu se nudi da odabere informaciju za koju želi da mu bude poslata. Kada izvrši izbor (govorom ili tonskim biranjem) govorni automat ga poziva da unese telefonski broj svoje fax mašine. Odabrani fax se potom automatski šalje. Preduzeća na ovaj način šire informacije o svojim proizvodima.
Servis praćenja (engl. Follow Me - One Number Service) daje mogućnost praćenja korisnika kada ovaj nije na svom radnom mestu. U početnoj fazi je potrebno sastaviti spisak korisnikovih ostalih telefonskih i pejdžer brojeva. Sistem zatim poziva te brojeve definisanim redosledom, a pruža i mogućnost da pozivalac ostavi govornu poruku. Postoji i mogućnost da se poziv uputi istovremeno na sve brojeve sa liste.
Praćenje radnog vremena i aktivnosti zaposlenih može se vršiti automatski, što može da bude interesantno za veliki broj preduzeća. Svaki zaposleni ima lični identifikacioni broj sa kojim se javlja kad stigne na određeno radno mesto (odnosno kada počinje da radi) i kad ga napušta. Po potrebi se može uključiti i provera glasa, tj. verifikacija govornika. Na osnovu ovih informacija sistem može dati informacije o trenutnoj aktivnosti zaposlenih, kao i zbirne informacije za automatski obračun. Jedan primer je rad u distribuiranim pozivnim centrima.
Obezbeđenje i kontrola pristupa objektima i kretanja kroz velike zgrade od posebnog interesa može se vršiti audio-vizuelnim postupcima: kamerama, kao i identifikacijom i verifikacijom govornika - prepoznavanjem njegovog glasa kao jedinstvenog biometrijskog obeležja.
9X servisi (milicija, hitna pomoć, vatrogasna služba) mogu da se unaprede tako da CTI sistem na osnovu automatske identifikacije broja pozivaoca utvrdi adresu odakle dolazi poziv. Ovo je važno jer ljudi pozivaju ove brojeve kada su veoma uzbuđeni i uplašeni, te često nisu u stanju da pruže tačne informacije, pa čak ni da kažu gde se nalaze – npr. u slučaju saobraćajne nezgode.
98X servisi mogu se dobrim delom automatizovati što povećava efikasnost zaposlenih na pružanju ovog tipa informacija i broj poziva koji se mogu opslužiti, a ujedno smanjuje i čekanje. Sistem može da prihvati poziv, saopšti pozdravnu poruku i stavi poziv u red za čekanje. Operater tada prihvata samo ključne informacije, unosi ih u računar, a sistem sam pronalazi informaciju i saopštava je pozivaocu.
9XXX servisi reprodukuju snimljene sadržaje zabavnog karaktera ili daju neke informacije, ali bez mogućnosti izbora bilo kakvih opcija: pozivalac poziva broj i sluša sadržaj koji se neprekidno ponavlja. Ovakvi servisi se obično naplaćuju nešto iznad cene redovnog poziva. Sofisticiraniji sistemi omogućuju korisnicima da biraju sadržaje koje žele da čuju ili da se po potrebi njihov poziv prosledi do operatera.
Poziv na račun pozvane strane (engl. Call Collect Service) može da se obavi bez posredstva živog operatera: korisnik poziva poseban telefonski broj i sistem traži od njega da se predstavi i saopšti ili tonski bira telefonski broj sa kojim hoće da uspostavi vezu. Pre nego što se veza uspostavi, pozvana strana čuje snimljeni glas osobe koja je inicirala poziv i, na pitanje da li prihvata poziv na svoj račun, odgovara sa DA ili NE.
Telefonoteke u tradicionalnoj štampanoj formi predstavljaju spiskove adresa i telefonskih brojeva koji su kategorizovani prema vrsti proizvoda i usluga koji se oglašavaju. Telefonoteke obično sastavljaju lokalne telefonske kompanije i besplatno ih distribuiraju svim domaćinstvima. Naravno, oglašavanje u telefonoteci se naplaćuje. Svaki oglas sadrži broj telefona i adresu kao i osnovne informacije o proizvodima i uslugama. Međutim, pošto se ovi spiskovi ažuriraju samo povremeno, telefonoteke ne mogu obuhvatiti informacije o prodavcima i proizvodima koje se često menjaju. Telefonoteke bazirane na govornim automatima se lakše ažuriraju, tako da mogu da pruže i takve informacije, a mogu otići i korak dalje i proslediti poziv do odabranog objekta. Takav sistem može da zaštiti privatnost onog ko daje oglas, tako što se pozivi automatski prosleđuju do njega, a da zainteresovani pozivalac ne sazna koji je telefonski broj u pitanju.
Kataloška prodaja je takođe veoma interesantna za primenu govornih automata. Centri za telemarketing poseduju govorne automate koji prihvataju pozive i od pozivaoca traže osnovne informacije i podatke, npr. za koji proizvod ili uslugu je zainteresovan, potom mu saopštavaju osnovne informacije o proizvodu ili usluzi, pre nego što proslede poziv do odgovarajućeg agenta prodaje koji prima konkretnu narudžbinu i može da se usredsredi na specifične detalje prodaje. Drugi pristup – sa datim kataloškim brojevima proizvoda – omogućuje potpunu automatizaciju procesa naručivanja proizvoda, pa i naplate. Pozivalac unosi broj kataloga i kataloški broj proizvoda koji želi da poruči. Potom sasluša detaljnije informacije o raspoloživim modelima, veličinama, boji i sl. Sofisticiraniji sistemi omogućuju kupcima i da izvrše porudžbinu unosom broja svoje platne kartice.
Stanje na putevima obično se saopštava preko radio stanica, ali je korisno da vozač može da dobije informaciju (baš kad mu treba) o situaciji u saobraćaju na pojedinim putnim pravcima. Isto tako, u većim gradovima, vozačima su često potrebne informacije o zastojima u pojedinim ulicama i o predloženim putnim pravcima.
Tehnička podrška se može poboljšati korišćenjem sistema za automatsku distribuciju poziva do prvog slobodnog radnika službe, sa ciljem povećanja efikasnosti. Pozivaoci potvrđuju svoj status registrovanog korisnika tako što unose serijski ili registracioni broj, a sistem na osnovu toga i odgovora na nekoliko pitanja kategorizuje korisnikov problem i prosleđuje poziv odgovarajućoj osobi u tehničkoj službi. Korisnici preko faxa na zahtev mogu dobiti odgovarajuće informacije o proizvodu, tehničkim unapređenjima, kao i dijagrame i odgovore na najčešća pitanja. Određen nivo tehničke podrške na ovaj način može da se pruži i van uobičajenog radnog vremena.
Marketing dobija mogućnost difuzije faksimila na kompletne spiskove fax adresa. Poručivanje i provera statusa porudžbina mogu se automatizovati. Svaka porudžbina dobija svoj broj koji pozivalac koristi prilikom provere statusa porudžbine. Sistem je povezan sa odgovarajućim bazama podataka o statusu koji se pozivaocu mogu automatski pročitati naglas.
Popunjavanje formulara često je problem jer se zahtevaju dodatni dokumenti, slike i sl. koje obično nemamo pri ruci, pa je važno pre odlaska u instituciju dobiti informacije o tome šta nam je za određene potrebe neophodno i koliku taksu je tim povodom potrebno platiti. Primera radi, sistemi koji daju takve informacije bili bi zanimljivi za ambasade koje izdaju vize: pored spiska neophodnih dokumenata, govorni automat bi u ovom slučaju mogao da pruži i dodatne informacije, kao što su adresa objekta, radno vreme i važni telefoni.
Anketiranje se može automatski izvršiti i iskoristiti za razne namene: pri istraživanju tržišta, ispitivanju javnog mnenja i sl. Anketari biraju iz baze podataka subjekte koji će biti anketirani. Potpuno automatizovani sistem poziva brojeve po spisku i redom postavlja niz unapred snimljenih uobličenih pitanja na koja dobija odgovore prepoznavanjem govora ili tonski biranih cifara.
Izbori bi se, zbog sumnje u regularnost, teško mogli realizovati na osnovu govornog automata, ali se zato čitav niz pratećih aktivnosti vezanih za izbore može veoma elegantno rešiti na taj način. Provera biračkih spiskova, odnosno utvrđivanje u kojoj biračkoj jedinici je registrovan svaki birač, mogla bi da se obavi preko govornog automata koji ima pristup jedinstvenoj bazi podataka. Sličan automat mogao bi da se upotrebi i radi ispitivanja javnog mnenja u ispitivanoj regiji, kao i da pruži trenutan uvid u rezultate izbora na osnovu uzorka obrađenog do određenog trenutka.
Vanredne situacije u velikim objektima i sistemima, kao što su požari, poplave, zemljotresi, nestanak struje-osvetljenja, pojava otrovnih gasova, bekstvo zatvorenika, bombardovanje i sl. po pravilu dovode do panike, neadekvatnih i pogubnih reakcija, pa je u takvim situacijama dragocena pomoć sistema koji će po utvrđenom redosledu automatski pozivati određene telefonske brojeve i saopštavati prave instrukcije. Te instrukcije mogu biti unapred snimljene, ili saopštene sa jednog mesta od strane odgovornog lica.
Mobilizacija se mora obaviti maksimalno brzo i efikasno. To se najbrže može izvesti pomoću sistema koji bi za kratko vreme inicirao veliki broj telefonskih poziva i reprodukovao unapred snimljene direktive. Pozivi na koje se ne dobije odgovor ili su zauzeti, ponavljali bi se do daljnjeg.
Banke svojim poveriocima omogućuju permanentan pristup računu u banci. Oni unose svoj broj računa i lični pristupni broj i dobijaju pristup čitavom nizu servisa: mogu da ustanove aktuelno stanje na svom računu, datum kada je zabeležena poslednja promena, mogu da poruče čekove ili izveštaj o uplatama na fax, mogu da iniciraju transfer sredstava sa jednog računa na drugi i tako izvrše određena plaćanja i sl. Ovakvi servisi su zanimljivi kako za tekuće, žiro i devizne račune, tako i za račune vezane za kreditne kartice, mada se tu češće koristi direktna veza sa odgovarajućim referentima kreditne kompanije. Prilikom isplata iznad određenog limita, šalterski službenici iniciraju proveru stanja na računu u centralizovanoj bazi podataka. Osim toga, banke sa govornim automatima mogu da ponude i informacije o svom poslovanju, o deviznom kursu, kao i informacije o kreditnim aranžmanima i pozajmicama – kamatama izračunatim na osnovu iznosa i tempa vraćanja kredita za koji se pozivalac izjasni.
Zdravstvo može značajno da unapredi neke aspekte svoje delatnosti pomoću CTI sistema. Bolnice koriste automatsko prosleđivanje poziva i sistem govornih poruka kako bi oslobodile osoblje za važnije delatnosti. Pozivaoci dobijaju informacije o pacijentima direktno ili uz pomoć CTI sistema. Pozivaoci mogu i da ostave govorne poruke za pacijente. Osim toga, govorni automati daju informacije o vremenu za posete, a mogu da automatizuju i zakazivanje termina: pacijenti biraju lekara kod kog žele da dođu na pregled, dobijaju informaciju o raspoloživim terminima i biraju željeni datum i vreme. Otkazivanje rezervisanog termina može se takođe vršiti pomoću jednog ovakvog sistema. Računar sređuje ove informacije i dostavlja osoblju medicinskog centra spisak rezervisanih termina. Sistem se može programirati tako da automatski pozove i podseti pacijenta jedan dan pre zakazanog termina. Zdravstvena služba može trajno da stavi na raspolaganje razne informacije o lekovima. Informacije o pacijentima koje se inače nalaze u zdravstvenim kartonima mogu se držati i u odgovarajućim bazama podataka sa kontrolisanim pristupom. Takođe, uz odgovarajuću autorizaciju i lekari i pacijenti mogu pristupiti bazama podataka sa rezultatima laboratorisjkih testova i nalaza.
Elektrodistribucije dobijaju ekstremno povećan broj poziva kada iznenada nestane struje u nekom regionu ili delu grada. Ovakav obim saobraćaja potpuno blokira telefonski sistem i onemogućuje njegovu upotrebu po pitanju preduzimanja odgovarajućih akcija. Jedan govorni automat može da odgovori na sve takve pozive, reprodukuje snimljenu poruku, a, pored toga, na osnovu automatske identifikacije broja pozivalaca locira oblast iz koje stižu pozivi i odmah pozove i obavesti odgovorne dispečare. Mogu se davati informacije o grupama za isključenja u režimu planiranih isključenja, kao i informacije o havarijskim isključenjima.
Komunalne organizacije (vodovod, čistoća i sl.) mogu da izveštavaju javnost o planiranim aktivnostima kako putem javnih medija, tako i putem govornih automata, kojima građani mogu da pristupe u svako doba da bi došli do informacija koje su im promakle na radio ili TV programu.
Aerodromi koriste CTI sisteme za saopštavanje informacija o letovima, čime se efikasno opslužuje veliki deo poziva i rasterećuje osoblje na terminalima. Isti sistem pruža informacije o dolaznim i odlaznim letovima, a pozivalac bira broj leta koji ga zanima.
Autobuske i železničke stanice, kako one regionalne, tako i međunarodne, koriste govorne automate za efikasno davanje informacija o polascima. Pozivaoci takvih sistema saslušaju listu postojećih pravaca i biraju liniju za koju su zainteresovani, iil jednostavno izgovore pravac koji ih zanima. Govorni automat potom saopštava vremena polazaka/dolazaka počev od tog trenutka. Sofisticiraniji sistemi mogu da proslede poziv do odgovarajućeg šaltera za prodaju karata gde može da se izvrši i željena rezervacija.
Veleprodajni magacini mogu značajno da povećaju efikasnost korišćenjem sistema koji obuhvata govorni automat. Inventarski podaci mogu se održavati u ažurnom stanju. Prodavci mogu jednostavno da unesu inventarski broj ili po imenu odaberu predmet i dobiju informaciju o raspoloživim količinama i ceni, o lokaciji u magacinu, izvrše porudžbinu. Informacija o porudžbini odmah ide na printer i inicira se dostava, a stanje se automatski ažurira. Podaci o raspoloživim količinama robe u magacinima se evidentiraju i prosleđuju nabavnoj službi. Kupcima se može ponuditi servis preko kog proveravaju status svojih porudžbina, tako što unose broj porudžbine ili fakture, a sistem nakon uvida u odgovarajuću bazu podataka daje odgovor sa obrazloženjem eventualnog kašnjenja i procenjenim rokom isporuke.
Servisi za popravku automobila koji koristi govorni automat omogućuje mušterijama da pozovu u bilo koje doba dana, unesu broj naloga za popravku, i dobiju informacije o statusu popravke (cena, vreme preuzimanja, potreba za daljim popravkama i sl.). Govorni automat može da primi informacije o načinu naplate (npr. broj platne kartice), da inicira naplatu i pripremi odgovarajući račun. Govorni automat može automatski i da pozove vlasnika vozila - da ga obavesti da su kola popravljena, koliko to košta i kada može da ih preuzme.
Fakulteti studentima mogu preko govornog automata da pruže niz korisnih informacija. Tonsko biranje ili prepoznavanje govora omogućuju studentima da prijave ispit bez čekanja u redu. Prilikom pristupanja personalnim uslugama, student se identifikuje brojem indeksa i ličnim identifikacionim brojem. Studenti mogu da poruče raspored i da ga dobiju e-mailom ili faksom. Studenti mogu preko govornog automata da dobiju i informacije o dnevnom i nedeljnom jelovniku u menzama.
Škole su zainteresovane za mogućnost da poruke za roditelje đaka koje se inače šalju po deci (a onda umeju da se zagube ili preprave), mogu de se unesu u računar i distribuiraju roditeljima po utvrđenom spisku. Roditelji ponekad nisu sigurni da li su deca upamtila šta sve treba da urade za domaći zadatak, pa ni da li su bila na času. Takve informacije se takođe mogu jednostavno staviti na raspolaganje preko govornog automata.
Radio i TV program u kontakt emisijama može se takođe osloniti na govorne automate. Na primer, kada slušaoci ili gledaoci treba da glasaju, oni pozivaju određeni telefonski broj. Javlja im se automat, prihvata njihov izbor i daje pregled ishoda glasanja, koje može da se odnosi, recimo, na izbor muzičkog hita ili filma koji će biti emitovan. Za određene vrste radio programa kao što su kvizovi posebno je zanimljivo i uspostavljanje konferencijskih veza. Povećan broj poziva beleži se i neposredno nakon emitovanja TV shop telefonskih brojeva, kada broj dolaznih telefonskih linija obično više nije dovoljan da bi svi pozivi mogli biti opsluženi. Govorni automat koji može da razgovara sa desetinama ljudi istovremeno je tada od velike pomoći.
Provajderi kablovske televizije pružaju servis "video na zahtev" (engl. Video on Demand), koji omogućuje gledaocima da poruče i gledaju odabrane filmove iz videoteke date kablovske kompanije. Poručivanje ove vrste usluge, izbor filma i proces naplate mogu se automatizovati pomoću govornog automata. Gledalac poziva dati telefonski broj i u konverzaciji sa govornim automatom bira žanr i naslov filma. Naplata se odvija automatski preko automatske identifikacije broja (ANI) pozivaoca i pridruživanjem tog broja odgovarajućem pretplatniku kablovske distributivne mreže. Osim ovog servisa, vlasnici kablovske televizije mogu da ponude pretplatnicima i da biraju poseban program koji bi im se deskremblovao i emitovao u željeno vreme. Ovakve usluge takođe se mogu u potpunosti automatizovati.
Provajderi mobilne telefonije uveli su niz servisa koi se oslanjaju na govorne automate. Na primer, provajderi mobilne telefonije pružaju svim pretplatnicima mogućnost snimanja govornih poruka u vreme kada korisnik nije u prilici ili ne želi da prihvati poziv. Pejdžing sistem i sistem računarske telefonije mogu da se povežu tako da informacije o prispelim porukama budu prosleđene na odgovarajući pejdžer. Korisnik može, primera radi, da postavi zahtev da svi pozivi upućeni njemu u intervalima od 7 do 8 i od 14 do 15 sati budu preusmereni na njegov telefon u kolima, pozivi u periodu od 8 do 14 časova u kancelariju, a od 15 časova nadalje da idu preko pejdžera ili da se usmere na servis govorne pošte. Automatsko prepoznavanje govora se sve više koristi za ove svrhe, jer govor predstavlja najprirodniji interfejs, što je od izuzetnog značaja za mobilne korisnike. Iniciranje telefonskih poziva glasom je još jedan od mnogih popularnih servisa. Pozivalac može da izgovori broj ili da kaže određenu reč ili frazu (npr. "zovi kancelariju"), na šta govorni automat, oslanjajući se na prepoznavanje govora, upućuje odgovarajući poziv. Za ovo se, doduše, uglavnom koristi prepoznavanje govora zavisno od govornika, jer je nešto tačnije, a i dovoljno je jednostavno da bi se moglo implementirati u samom mobilnom telefonu. S druge strane, složenije servise kao što su identifikacija govornika ili prepoznavanje govora nezavisno od govornika moraju da ponude sami provajderi.
Pozorišta, bioskopi, koncertne dvorane… Nakon izbora željene predstave ili koncerta, kao i izbora sedišta, pozivaoci mogu i da izvrše rezervaciju. Od njih se traži da unesu broj svoje platne kartice, pa se, nakon provere njenog statusa, zahteva još i da unesu svoj broj telefona i adresu na koju će karte biti isporučene. Ovakvi sistemi često imaju mogućnost upoznavanja pozivalaca sa nastupajućim predstavama ili koncertima, tako da pozivaoci mogu da dobiju detaljnije informacije o događaju koji ih posebno zanima, a da pritom ne moraju da preslušavaju dugačke i zamorne spiskove. Sponzorima pojedinih manifestacija može se dodeliti poseban telefonski broj preko koga mogu da pruže najvažnije informacije vezane za koncert, pa čak i pozdravne poruke izvođača uoči samog nastupa. Pozorišta i bioskopi mogu da ponude informacije o aktuelnim predstavama, kao i o adresama i telefonskim brojevima blagajni. Pored toga, pozivaoci mogu da poruče na fax kompletne programe, raspored sedišta u sali, uputstvo kako da nađu objekat i sl.
Turističke agencije svojim klijentima mogu da ponude i informacije koje su posebno značajne za one koji putuju u inostranstvo. Nakon izbora zemlje u koju putuju, pozivaoci dobijaju informacije o klimi i aktuelnim vremenskim prilikama, o trajanju putovanja i vremenskim razlikama, informacije o lokalnim valutama i kursevima, o lokalnom saobraćaju, savete vezane za očuvanje zdravlja i sl. Sistem može da pruža ove informacije i na više jezika.
Hoteli mogu automatizovati niz usluga koje pružaju, počev od rezervacije, preko davanja osnovnih informacija o hotelu, njegovim servisima, restoranima, zabavnim sadržajima, pa do informacija o kulturno-umetničkim i zabavnim sadržajima i zbivanjima u gradu. Naravno, uvek je potrebno ostaviti mogućnost povezivanja sa živim operaterom kao alternativu, za goste koji to više vole ili žele detaljnije informacije. Sistem može da obuhvati i servis govorne pošte za svakog gosta hotela. Gosti često imaju potrebu da naručuju buđenje tako da govorni automat mora umeti da prihvati takve zahteve. Sistem tada može da uputi poziv za buđenje u zakazano vreme. Ako ne dobije odgovor na poziv, ili linija bude zauzeta, poziv se ponavlja u programiranim intervalima.
Lokator objekata može da pomogne korisnicima da pronađu željeni objekat u gradu. Korisnik poziva određeni telefonski broj, saopštava ime grada i vrstu objekta koja ga zanima (hotel, turistička agencija, rent-a-car služba i sl.). Sistem mu saopštava listu najbližih objekata te vrste, zajedno sa adresama i telefonima. Bilo bi poželjno da sistem bude u stanju da prosledi vezu do traženog objekta ako to pozivalac poželi.
Umetničke galerije i privatni dileri suočeni su sa veoma zahtevnim kupcima na koje dobro osmišljeni govorni automat može da ostavi značajan utisak. Pozivalac bira određenog umetnika ili konkretno umetničko delo i potom sluša snimljeni opis traženog dela, a poziv se može proslediti do dilera ili galerije ako je pozivalac zainteresovan za dodatne informacije ili kupovinu. Na taj način dileri mogu sačuvati diskreciju.
Agencije za trgovinu nekretninama mogu efikasno da primene govorne automate. Takav sitem može da pomogne potencijalnim kupcima, tako što u konverzaciji sa njima dobije bliže informacije o njihovom interesovanju (okvirna cena, lokacija od interesa, broj soba, stil gradnje itd.), a zatim automatski odabere iz ponude objekte koji se uklapaju u zadate okvire. Ako pozivalac to želi, može da dobije telefonski broj agenta zaduženog za određenu prodaju, a sistem može i da prosledi poziv do tog agenta.
Osiguravajuća društva mogu automatizovati davanje informacija o statusu zahteva za nadoknadu štete. Svakom rednom broju zahteva pridružen je odgovor koji se saopštava pozivaocu. Osim uobičajenih odgovora, mogu se davati i informacije o dokumentima koje je još potrebno podneti, a moguće je i proslediti pozive do odgovarajućih agenata.
Kladionice mogu da ponude aktuelne informacije o ishodima predmeta klađenja – na primer, rezultate sportskih takmičenja. Pozivalac bira redni broj meča koji ga interesuje, a govorni automat sintetizuje govornu informaciju o trenutnom stanju ili ishodu meča. Na sličan način može se automatizovati i samo klađenje.
Horoskop se može organizovati na klasičan način: pozivalac izgovara svoj horoskopski znak, računar to prepoznaje i saopštava sadržaje vezane za taj znak. Osim toga, računar može i da, nakon što uzme od pozivaoca potrebne podatke (datum, tačno vreme i mesto rođenja), automatski generiše lične horoskope. Pozivaoci mogu poručiti i detaljniji lični horoskop preko faxa.
Zabavni sadržaji mogu na veoma efektan način da se ponude putem govornih automata. Različiti sadržaji mogu da se ponude na istom broju, a pozivalac vrši izbor tonskim biranjem ili izgovaranjem odgovarajućih opcija. Informacije se mogu ticati lokalnih kulturno-umetničkih, sportskih i ostalih događanja, TV i radio programa, recepata, horoskopa, muzičkih hitova itd.
Govorni Web. Nove govorne tehnologije – prepoznavanje govora i govornika i sinteza govora – otvaraju prostor za jedan novi koncept komuniciranja, tzv. govorni Web, odnosno pristup Internetu pomoću telefona, dakle bez računara. Očekuje se da govorni web otvori niz novih mogućnosti za ostvarivanje prihoda, kroz pružanje novih atraktivnih korisničkih servisa preko telefona i funkcionisanje tzv. v-komerca.