Bing

Microsoft обявява, че неговата технология за разпознаване на реч намалява процента на грешки и е толкова ефективна, колкото хората

Anonim
"

Това е един от стълбовете, върху които мнозина твърдят, че различните платформи ще растат в близко бъдеще. Нищо за взаимодействие с писмени команди или жестове. Бъдещето е в говоренето с машини, но без говорене с роботизирани команди и неестествени заповеди. Ще го направим с естествен език, нещо, което оценяваме все по-ясно в личните асистенти."

И една от фирмите, която има най-забележителна кариера в този смисъл, е Microsoft, компания, която има път на развитие, в който работи за постоянно подобряване на гласовото разпознаване на служителите след това на техните платформи.Технология, за която вече имаме новини от екипа за разработка, новини, които говорят за голямо подобрение, което я поставя на същото ниво на прецизност като използваното сред хората

В този смисъл те обявиха, че системата им за гласово разпознаване е достигнала 5,1% в WER, тоест грешката в скоростта на използваната дума. За мнозина това може да не говори нищо, но е изненадващо, ако видим как от една страна тази скорост е същата като тази, която откриваме в общуването между хората

За да направят това, от Redmond избраха да използват подобрени модели на вербален и акустичен език, базирани на използването на невронни мрежиТова са Те са комбинирани с дългосрочна двупосочна памет, така че да се подобри акустичното моделиране, като по този начин се подобри разпознаването благодарение на предвиждане на думите, които могат да се използват въз основа на история на комуникация.Тези подобрения също имат подкрепата на облака благодарение на усилията, които компанията полага за подобряване на инфраструктурата за облачни изчисления, особено с Azure.

Освен това, това означава, че този процент грешки е намален по отношение на границата на отказ, тъй като преди беше на 5,9%, като по този начин пада от 12%, което беше числото, което системата имаше преди по-малко от година. Следователно Microsoft е постигнала система за разпознаване на реч, толкова ефективна, колкото тази на хората, и виждайки напредъка, който поемат, не е изненадващо, че дори ще я подобрят през следващите месеци или години.

Кой знае дали след няколко години разговорите с нашия компютър с Windows, взаимодействието с Cortana или приложения като Office ще бъдат нещо толкова естествено, колкото това, което вече са ни карали да мечтаем (или да имаме кошмари, кой знае) в киното.

В Xataka | Те не са гласове отвъд гроба, те са скрити команди, които гласовите асистенти разпознават, а хората не

Bing

Избор на редакторите

Back to top button