Откъдето и да го погледнем, технологичното бъдеще е тясно свързано с развитието и усъвършенстването на изкуствения интелект /AI/, интерактивните гласови асистенти и управлението чрез жестове. Управление на устройства директно чрез мисълта също попада в полезрението, но като че ли на този етап звучи по-скоро футуристично. Управлението на всякакъв тип технология чрез глас обаче не е нова концепция. Почти всички смартфони разполагат с подобни асистенти. Те са част от ежедневието ни. Следвайки силата на технологиите, тези асистенти имат възможностите да забавляват, развличат или да ни помагат в организацията на ангажиментите ни. Разбира се, има накъде да се развият до ниво J.A.R.V.I.S.
Технологичните гиганти в битка за надмощие
Усещайки тренда, не е изненада, че големите компании постоянно инвестират в гласовите си асистенти. Логично гласовият асистент, който изпълнява командите, които му задаваме, без затруднение, ще има огромно предимство в сферата на технологиите, а компанията създател ще бъде все по-разпознаваема сред потребителите. Но най-голямото предимство може би ще имат гласовите асистенти, с които комуникацията ще се доближава най-силно до тази с човешко същество и освен команди ще разбира настроенията ни, чувството ни за хумор или сарказма. На този етап големите компании като Google, Apple, Microsoft и Amazon използват огромни ресурси в посока за усъвършенстване на техните гласови асистенти – Google Assistant, Siri, Cortana и Alexa. Тези технологии се срещат както в смартфони и таблети, така и в устройства за дома. Докато Siri и Google Assistant се използват основно при смартфони и таблети, то Alexa (името идва от древната библиотека в Александрия) позволява управлението на т.нар. Echo смарт колонка, с която можете да управлявате съвместими устройства – управление на гаражни врати, управление на светлините в дома, камери за сигурност, кухненски уреди и други. Cortana пък е гласовият асистент на Microsoft, като той се среща масово сред устройства, които работят с операционната система Windows 10, където програмата е вградена.
Технологиите зад Гласа
Когато „разговаряме” с някой от виртуалните гласови асистенти или пък задаваме команди, се извършва доста сложен процес, при който асистентът трябва да анализира нашата реч и съответно да даде отговор или да изпълни командата ни със светкавична скорост. В най-общи линии речта се конвертира в текст, анализира се и се оформя отговор отново в текст, който се конвертира обратно в глас. За да конвертира гласът в текст се използва т.нар. NLP технология (Natural Language Processing или обработка на естествен език), която е базирана на AI технология. Докато гласовите асистенти набират скорост, уеб компаниите са изправени пред предизвикателствата за обработката на големия поток от данни. За справяне с него те въвеждат различни технологии, като една от тях е т. нар. Deep Neural Networks (DNNs). Машинна невронна архитектура за обучение, която използва Deep Learning, , което буквално означава „дълбоко обучение”. Всъщност Deep Learning e свързан с изкуствените невронни мрежи (ANN). Това са компютърни системи, които са изградени по подобие на човешкия мозък. Идеята е по този начин да има възможност да се обработва огромното количество данни, като след анализ впоследствие предават информацията от един слой към друг. За целите на обработката и анализ е необходим огромен ресурс за съхранение на данните (дейта центрове). Най-често целият процес се извършва в облачни системи, свързани със самите гласови асистенти.
Друга интересна технология е HEIM или Hybrid Emotion Inference Model. В основата си HEIM представлява „машинно обучение” (ML) или технология, която предизвиква натрупване на знание у самото устройство. Докато хората са способни да разбират емоциите на другите по интонацията на гласа им, при машините това не е толкова лесно, но все пак има напредък и в тази посока. За да се разкрият какви точно са емоциите зад гласа ни, HEIM използва хибридната комбинация от Latent Dirichlet Allocation (LDA) – програма за обработка на естествения език и Long Short-Terme Memory (LSTM) технология, която моделира акустичните характеристики, за да разкрие емоционалния заряд на думите.
Рисковете
Несъмнено много хора са почитатели на виртуалните гласови асистенти. Това се дължи и на цялостното развитие на технологиите и в това число развитието на изкуствения интелект (AI). AI става все по-интуитивен, с все повече човешки характеристики. Може ли обаче, също както във фантастичните филми AI да се развие до такава степен, че да застраши нашата лична неприкосновеност – да взема решения, които биха променили живота ни, без нашето изрично съгласие Въпреки, че се говори за случаи, при които устройства с гласови асистенти са записвали разговорите на техните собственици, отговорът е по-скоро „не”.
При всички случаи техниката е навсякъде около нас, тя е част от нашето ежедневие. Доколко обаче ще ни бъде от полза в близкото бъдеще или ще ни изложи на по-голям риск, застрашаващ нашата неприкосновеност, предстои да видим.