Bing

Microsoft Research създава система, способна автоматично да генерира „интелигентни“ надписи

Съдържание:

Anonim

Със сигурност сте попадали на надпис, който е объркващ, неправилен или казва малко за изображението, за което се отнася; и дори е възможно, ако се посветите на публикуването на свои собствени статии, да намерите най-много досадно да попълвате този раздел. Е, хората от Редмънд създадоха инструмент, който цели да улесни нещата за вас.

Произведение, публикувано от Microsoft Research, което се описва като „система за генериране на надписи“, способна да имитира наративните характеристики на човешкия език, тоест технология, която може да описва екранни снимки, сякаш за един от нас, със съответния контекст.Нещо, върху което компании като Facebook, Microsoft и Google работят от известно време, но този път надминава очакванията.

От какво се състои

Той си прекара страхотно

По този начин системата има способността дори да разкаже пълна история от няколко изображения, като я описва и разказва така, сякаш беше книга. Помощна програма, която според експерти може да се превърне в функция, която осигурява по-човешко отношение към определени приложения, приложения за разпознаване на глас, автоматично генериране на описания в други области и много други.

И факт е, че инструментът не се ограничава до това да каже накратко какво „вижда“, а по-скоро предоставя по-широко контекст на ситуацията, която е отразена в изображението, постигайки "наративен контекст и уникален стил на разказване", обясни Франк Фераро, един от авторите на тази творба.За да се поставим в ситуация, той ни дава ясен пример

Майка му се гордееше с него

Така че предлагаме следния случай: „Нека си представим, че имаме албум със снимки на приятели, които са празнували рожден ден в кръчма Някои от първите изображения показват хора, които си поръчват бира и я пият, докато последните показват някой заспал на дивана”, коментира той.

Една конвенционална система „може просто да посочи нещо като човек, който лежи на диван, докато нашата система може да включва, че той вероятно е в тази ситуация, защото е пиян след няколко питиета“ . Допълнение, което осигурява разбиране и известен емоционален заряд, който също се отразява в изображенията и надписите към снимките, включени в тази статия.

През | MIT Technology Review

В Xataka Windows | Microsoft пуска приложение, което определя породата на вашето куче

Bing

Избор на редакторите

Back to top button