Bing

Microsoft Research створює систему, здатну автоматично генерувати «розумні» підписи

Зміст:

Anonim

Напевно, ви натрапили на підпис, який заплутаний, неправильний або мало говорить про зображення, до якого він відноситься; і навіть можливо, що, якщо ви присвятите себе публікації власних статей, вам буде найбільш нудним заповнювати цей розділ. Що ж, люди з Редмонда створили інструмент, який покликаний полегшити вам роботу.

Робота, опублікована Microsoft Research, яка описує себе як «система створення субтитрів», здатна імітувати наративні характеристики людської мови, тобто технологію, яка може описувати знімки екрана так, ніби про одного з нас, з відповідним контекстом.Те, над чим такі компанії, як Facebook, Microsoft і Google, працюють протягом деякого часу, але цього разу воно перевершує очікування.

З чого складається

Він чудово провів час

Таким чином, система має можливість навіть розповісти повну історію з кількох зображень, описуючи її та розповідаючи так, ніби це була книга. Утиліта, яка, на думку експертів, може в кінцевому підсумку стати функцією, яка забезпечує більш гуманітарний підхід до певних програм, програми розпізнавання голосу, автоматичне генерування описів в інших областях і багато іншого.

І справа в тому, що інструмент не обмежується лише короткими словами того, що він «бачить», а надає ширшу контекст ситуації, яка відображається на зображенні, досягаючи «оповідного контексту та унікального стилю оповіді», пояснив Френк Ферраро, один із авторів цієї роботи.Щоб поставити себе в ситуацію, він дає нам чіткий приклад

Його мати пишалася ним

Таким чином, ми пропонуємо такий випадок: «Уявімо, що у нас є фотоальбом друзів, які святкували день народження в Паб. На деяких з перших зображень люди замовляють пиво і п’ють його, а на останніх – хтось спить на дивані», – коментує він.

Звичайна система «може просто вказувати на те, що людина лежить на дивані, тоді як наша система може включати, що вона, ймовірно, перебуває в такій ситуації, тому що вона п’яна після кількох напоїв». Доповнення, яке забезпечує розуміння і певний емоційний заряд, який також відображається в зображеннях і підписах до фотографій, включених у цю статтю.

Через | MIT Technology Review

У Xataka Windows | Microsoft запускає програму, яка визначає породу вашої собаки

Bing

Вибір редактора

Back to top button