A hangfelismerő technológia életünkben.
Az elmúlt években a mesterséges intelligencia és más technológiák termékeny előrehaladását figyelhettük meg. Ezek mindegyikét részben azzal a céllal fejlesztik, hogy a mindennapi elektronikai eszközeinkkel való kapcsolódást még zökkenőmentesebbé és könnyebben hozzáférhetővé tegyék számunkra
A hangfelismerés technológiája egyike ezeknek az innovációknak, melynek elsőleges célja, hogy az eszközeinken végzett összes tevékenységünket hangvezéreltté formája, többek közt azért, hogy olyankor is minden eszközfunkció elérhető legyen, amikor épp nem tudjuk használni a kezünket, például vezetés vagy sportolás közben.
A kényelmi szempontoknál viszont sokkal nyomósabb érv, hogy míg egy perc alatt egy átlagember negyven szót képes begépelni, addig százötvenet képes kimondani, így a hangvezérelt kommunikáció nemcsak komfortosabb lehet, hanem majdnem négyszer olyan hatékony.
A tech óriások a döntő piaci részesedés megszerzéséért tülekednek, jelenleg a Google és az Amazon stratégiájának is a hangalapú technológia áll a középpontjában. Bár az okostelefonok kezdetben csak a sort megnyitó Sirinek és a Microsoft Cortanájának adtak otthont, 2018-ra a Google Asszisztense az okostelefonok majdnem 50%-án megjelent.
A jéghegy csúcsa
Amint eljutottunk arra a szintre, hogy az elektronikai eszközeinkkel való kommunikációnk maximálisan gördülékeny, felmerültek a puszta funkcionalitásnál kifinomultabb igények és szolgáltatások is.
Az ember természetéből adódóan társas lény, ez a tulajdonságunk pedig leképeződik minden emberi fejlesztésen, így a technológián is. Ki ne akarna egy olyan filmélményekből jól ismert, segítő szándékú és közel mindenható szuperszámítógépet az életébe, amely pillanatok alatt megírja az adóbevallást, optimalizálja a költségvetést, mindeközben világirodalmi jelentőségű szerelmes verset ír az évfordulónkra (hogy csak a legegyszerűbbeket említsük), mindezt azért, hogy mi saját életünk Maslow-piramisának csúcsán minden időnket az önmegvalósításnak és a világmegváltásnak szentelhessük?
A hangvezérelt okoshangszórók, mint a Google Home, Google Nest, Amazon Echo, Apple Homepod piaca gyorsabb növekedést mutat, mint bármilyen egyéb okosotthon-eszközé. 2019-ben már az amerikai háztartások 35%-ban legalább egy okoshangszóró jelen volt, 2025-re ez 75%-ra, és egyúttal egy 35 milliárd dolláros iparággá nőhet a becslések szerint. A felhasználók előszeretettel vásárolnak és várnak ajánlatokat ezeken az eszközökön keresztül.
A (nem is túl távoli) perszonalizált jövő
Az egyes technológiák összehangolásával pedig egyre megbízhatóbb és nagyobb teljesítményre számíthatunk a hangvezérlés területén. Az MI-alapú digitális hangtechnológiákkal való kapcsolatunk ennek köszönhetően fokozatosan el fog mozdulni a tranzakciós kommunikáció és az egyszerű parancsok teljesítésének szintjéről az önismeret és a társaság iránti vágyunk, ennek következményeként pedig az eszközökkel való minőségi kapcsolódás felé.
Ugyan ahhoz, hogy valóra váltsuk a hangfelismerésben rejlő lehetőségeket, még bőven van mit fejleszteni a technológián, a fent említett cégóriásoknak nyilvánvalóan megéri ezen fejlesztésekbe fektetnie, hogy piaci előnyhöz jussanak. Ezért is lehet, hogy a korábban tapasztalt léptékhez képest az elmúlt években elért eredmények elképesztőek. – Különös tekintettel arra, hogy a becslések szerint 2021-re több hangasszisztens lesz a bolygón, mint ember, ez pedig alapjaiban fogja megváltoztatni a digitális technológiával való kapcsolatunkat. És ha ebben a tempóban haladunk, akkor az is elképzelhető, hogy néhány év múlva már nem fikció lesz Spike Jonze 2013-as A nő című remekműve, hanem a mindennapi valóságunk.