Microsoft Is Teaching Computers для наблюдения как люди

microsoft

Исследователи компании разрабатывают системы, которые обрабатывают визуальную информацию как люди и могут ответить на вопросы о содержании фотографии.Поиски Microsoft для создания вычислительных систем, которые понимают мир вокруг них, не заканчивают Проектом компании Оксфордскую технологию машинного обучения.

Исследователи в Редмонде, Вашингтон, производитель программного обеспечения также разрабатывает системы, которые подражают, как люди вытягивают информацию от вещей, которые они видят.«Когда лицо спрашивают о чем-то в фотографии, они берут в большом количестве подробных данных много слов – для ответа на вопросы об этом», вел блог представитель Microsoft Атима Чансэнчай. «Теперь, команда исследователей Microsoft, вместе с коллегами из Университета Карнеги-Меллон, создала систему, которая использует машинное зрение, глубокое обучение и понимание языка, чтобы проанализировать изображения и ответить на вопросы тем же путем, люди были бы».

Вместе, исследователи создали модель, которая «применяет многоступенчатое обоснование для ответа на вопросы об изображениях», сказал Чансэнчай. Технология продвигается Ли Дэном, Ксиэодонгом Хэ и Цзяньфэн Гао от Microsoft Research’s Deep Learning Technology Center, вместе с исследователями Университета Карнеги-Меллон Зичэо Янгом и Алексом Смолой.

«Система берет в информации, человеческая пара глаз и мозг были бы, смотря на действие сцены (если существует кто-либо), и отношения среди многократных визуальных объектов», сказал Чансэнчай. «Хотя это может звучать простым для людей, это много для компьютера, чтобы выучить язык и найти ответы в изображении. Но с помощью глубоких нейронных сетей, это может».Дэн и его группа пропитывают систему с вниманием платежеспособности, фокусом на визуальных индикаторах и выводят ответы прогрессивно для решения проблем.

Это – продвижение в поведении человека, моделируя, который не был возможен несколько лет назад, сказал он.Microsoft предполагает это, работа приведет к системам, которые могут ожидать потребности человека и предоставить рекомендации в реальном времени.

Системы, которые могут ответить на вопросы, основанные на визуальной информации, являются также ключевыми для разработки инструментов искусственного интеллекта, по данным компании.Например, технология может потенциально привести к повышенному велосипедному уровню безопасности.

«Система могла привести в действие все виды приложений, такие как система предупредительной сигнализации для велосипедистов. Со смонтированной камерой, постоянно берущей в среде вокруг велосипедиста», сказал Чансэнчай.Система анализа изображения основывается на предшествующей работе Microsoft над технологиями, которые могут автоматически озаглавить фотографии. «Исследователи говорят, что это было важным шагом в получении к этой точке, потому что описания сцен, аннотируемых людьми, предоставляют значение изображению. Это помогает обучить компьютер понимать изображение путем, лицо было бы».

Microsoft все более и более полагается на системы машинного обучения как на способ помочь разработчикам создать новое поколение интеллектуальных приложений. В прошлом месяце компания объявила об общедоступной бете Проекта Оксфордское Понимание языка интеллектуальное обслуживание (LUIS), позволив кодерам создать приложения, которые понимают разговорные инструкции и поисковые запросы, подобные собственному виртуальному ассистенту Microsoft, Cortana.

Проектный Оксфорд является набором прикладных программных интерфейсов машинного обучения (API), который также включает поверхность и обнаружение эмоции, распознавание речи и машинное зрение.