写点什么

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘

  • 2018-11-22
  • 本文字数:2682 字

    阅读完需:约 9 分钟

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘

人工智能帮助我们构建基于说和写的人机接口,而不是使用键盘或鼠标;它让人保持人性。最大的挑战是找到方法告诉系统哪些答案令人不满意,以帮助它们学习,记录和保留的数据要保持透明,并确保训练数据的多样性和包容性,以防止人工智能系统的偏见。


2018年柏林Codemotion大会上,微软高级项目经理Christian Heilmann谈了使用人工智能构建人机接口。InfoQ 正以 Q&A、概述和文章的形式对此次大会进行追踪报道。


Heilmann 认为,我们已经越来越习惯把电脑作为我们生活的一部分。我们可能是将电脑视为连接到屏幕的键盘的最后一代人了。与总是待在那里的计算机交谈正成为一种常态——无论好坏。


Heilmann 指出,使用人工智能的方法创建接口使我们可以做人类所做的事——说话、写作和表达情感——我们创造出了恰当有用的工具,而又无需学习它们。为了使我们的接口更人性化,我们需要在我们积累的数据和我们得到的传感器读数中添加人类可以理解的信息。


人工智能的一大问题是夸大其词,给我们承诺了完美的科幻一般的接口。Heilmann 认为,如果 Siri 或 Cortana 听不懂你的话,你感觉更多的会是失望,而不是通过表单在数据集中找不到结果。我们向最终用户提供人机接口,因此,我们需要确保我们的代码和训练模型允许人为的随机性和错误。


InfoQ 采访了 Heilmann,谈了如何在人机接口中应用人工智能、人工智能带来的好处以及人工智能软件开发面临的主要挑战。


InfoQ:人工智能似乎已经成为软件开发的一个热点。为什么会这样?


Christian Heilmann:人工智能的话题已经讨论了很长一段时间了,但过去的技术现实阻碍了它的蓬勃发展。随着当今科技的进步,在海量数据集上进行深度学习的必要计算从几个月的数值运算下降到几秒钟。

我们积累的数据比以往任何时候都多——要么是有意识地拍摄了大量照片和录制了大量视频,要么是通过每台设备的传感器自动积累的。过去,我们编写的程序有明确的数据处理指令,而我们所收集的大量信息要求系统从数据本身中学习,并找到可以遵循的模式。

人在那里只是为了指出异常值和错误。当计算机可以更快、更好地进行模式检测和信息分类时,我们就不需要做那些枯燥而重复的任务了。


InfoQ:我们如何在人机接口中应用人工智能?


Heilmann:这已经发生了。照片软件会自动检测照片中的人和物,并将结果作为元数据添加进去,以方便检索。

例如,当你使用谷歌照片数周,并在自己的照片中搜索“食物”时,它将找到包含食物的照片,而你从来都没有描述过这些图片。这种便利性源于两个要素:大量的数据和自动检测及分类方法。这就是机器学习和深度学习的作用。

在大多数情况下,我们使用托管云服务来训练系统,因为计算开销非常高。然而最近,芯片组和语言方面的创新使我们可以从计算机体系结构的强大中获益,甚至使得在设备上实现这一功能成为可能。过去,我们必须拍照,发送到一个云服务,检测出它包含了埃菲尔铁塔,现在,我们的相机几乎可以实时地与已经存在的数据集进行比较,而没有任何第三方或连接速度开销。


InfoQ:在开发人机接口时,人工智能给我们带来了什么好处?


Heilmann:这里的关键是让人类保持人性。几十年来,电脑的使用并不令人兴奋,因为它们要求我们改变自己的生活方式。我们需要点击正确的按钮,以正确的顺序完成一项任务。我们需要记住密码和地址,并知道用于不同任务的程序。本质上,我们需要习惯于使用软件,并在享受它之前学会如何与它交互。

当你与 Cortana、Siri 或谷歌交谈时,你不需要使用键盘或鼠标,你可以问这样的问题:“今天丹麦首都的气温是多少?”,而不必知道首都是什么,或者告诉计算机“今天”是什么意思。

我们已经有了大量的数据,计算机可以分析数据而不需要我们做额外的工作。这样,我们就可以添加计算机为我们提出的问题提供正确结果所需的额外信息。

这里的主要变化是,人们开始以这种方式使用计算时没有想到它会失败。我总是惊讶于接口的智能化程度,但我已经习惯地认为电脑是愚蠢的。当你把一张照片拖到 PowerPoint 中,它会在后台创建一个人类可读的描述,向搜索引擎和非可视用户解释图片。例如,我使用我的狗的照片,而描述“一只狗坐在人行道上”是自动创建的。这太神奇了,我们应该以这种方式构建我们所有的系统。如果一个表单要求用户以某种格式提问,但用户输入错误时却得不到任何结果,那么这个表单就不合时宜了。我们应该做得更好。


InfoQ:AI 软件开发面临的主要挑战是什么?


Heilmann:我们仍然需要应对一些挑战。人工智能的关键在于规模和速度。为了从一个智能系统中得到一个好的结果,你需要有很多经过适当训练的数据,你需要问一些精确的问题来得到合理的结果。人类,作为一个整体,不善于提出正确的问题,所以通常一个智能系统会给出令人不满意的答案。我们需要找到一种方法来告诉系统为什么答案不令人满意,而不是在那之后把系统作为一个失败的产品而马上丢弃。机器不会受到感情上的伤害,所以告诉它们某件事是完全错误的,就像说它是正确的一样有效。

但我看到的主要挑战是,我们拥有很大的权力,我们处理人们的个人信息,有时甚至是身份相关的信息。作为一个注重安全和隐私的人,我担心人们为了方便而泄露太多的信息。你家的智能扬声器很像老间谍电影中旅馆房间里隐藏的麦克风。但是,我们可以接受每天 24 小时的生活记录,这样我们就可以问一台无处不在的电脑外面天气如何了。作为智能系统的提供者,我们不仅要提供出色的结果,而且还要向这些系统的用户灌输一种所有权意识,并对记录的数据、保留的数据和流向保持透明。

我们还需要小心,不要让机器学习放大我们的偏见。只在白人数据集上训练过的面部识别会告诉有色人种,不允许他们使用系统。这是不好的。我们需要确保多样性和包容性,那是我们的训练数据和接口的一部分,而不是迎合我们自己或我们想接触的人。


InfoQ:如果人们希望了解更多关于在软件开发中使用 AI 的信息,他们可以去哪里?


Heilmann:这是一个很开放的问题,也是一个很难回答的典型问题。大多数大型软件公司都有很好的门户网站,可以让你开始了解基础知识,但也可以使用预先构建好的数据集和 API 从深度学习中获益,而不必掌握它。以下是一些对我有所帮助的内容:微软AI新闻与活动深度学习网站

如果你对面向人类的人工智能感兴趣的话,可以看下我自己创建的一个持续更新的资源列表。


查看英文原文:https://www.infoq.com/news/2018/11/human-interfaces-ai

相关推荐


12 月 7 日北京 ArchSummit 全球架构师峰会上,来自 微软的技术专家将分享“微软小冰实时感官系统与未来发展趋势”、“基于 Kubernetes 的 DevOps”等相关经验与实践。详情点击 https://bj2018.archsummit.com/schedule


公众号推荐:

跳进 AI 的奇妙世界,一起探索未来工作的新风貌!想要深入了解 AI 如何成为产业创新的新引擎?好奇哪些城市正成为 AI 人才的新磁场?《中国生成式 AI 开发者洞察 2024》由 InfoQ 研究中心精心打造,为你深度解锁生成式 AI 领域的最新开发者动态。无论你是资深研发者,还是对生成式 AI 充满好奇的新手,这份报告都是你不可错过的知识宝典。欢迎大家扫码关注「AI前线」公众号,回复「开发者洞察」领取。

2018-11-22 14:321550
用户头像

发布了 1008 篇内容, 共 374.2 次阅读, 收获喜欢 341 次。

关注

评论 1 条评论

发布
暂无评论
发现更多内容

Solidity之旅十七-库 [library]

BSN研习社

功能强大的专业扫描套装:ExactScan Enterprise中文下载

胖墩儿不胖y

Mac软件 扫描工具

实践零信任(Zero Trust):步骤详解

Apifox

程序员 安全 API 接口安全 零信任

WiFi solution IPQ8072-IPQ8074 and network cards-5G: What performance debate in 5G era?

wifi6-yiyi

5G IPQ8072 wifi solution

Spring 应用合并之路(二):峰回路转,柳暗花明 | 京东云技术团队

京东科技开发者

工业 4.0 和数字孪生

3D建模设计

智慧城市 智慧园区 3D场景建模 3D数字孪生场景编辑器

mac VM虚拟机中文版 VMware Fusion Pro 13 密钥激活 附 安装教程

南屿

青否AI交互式数字员工正式上岗!

青否数字人

数字人

Calendar 366 II for Mac日历软件 最新版下载安装

南屿

Mac日历软件 菜单栏日历提醒工具 Calendar 366 II mac版 Calendar 366 II 下载

如何快速搭建AI数字人系统源码?

青否数字人

数字人

Studio One 6 for mac(音乐制作工具) v6.5.1完美激活版

mac

Studio One 音乐制作软件 苹果mac Windows软件

3D 纹理的综合指南

3D建模设计

3D渲染 3D材质编辑 3D材质纹理贴图

苹果电脑音乐制作工具有哪些?分享几款Mac端好用的音乐制作工具!

南屿

mac软件下载 mac音乐制作工具

零代码集成自动化的实现逻辑是什么?

RestCloud

零代码 APPlink

K-最近邻算法(KNN)是什么法?

小齐写代码

如何推动智能制造 - 数字孪生示例

3D建模设计

智慧城市 智慧园区 3D场景建模 3D数字孪生场景编辑器

好用的思维导图软件MindNode for mac中文版 支持mac14系统

南屿

Mac软件 MindNode破解版下载 思维导图软件MindNode

文心一言 VS 讯飞星火 VS chatgpt (172)-- 算法导论13.3 1题

福大大架构师每日一题

福大大架构师每日一题

速卖通商品列表数据接口(aliexpress.item_search)丨速卖通API接口

tbapi

速卖通API接口 速卖通商品数据接口 速卖通商品列表数据接口 关键词搜索速卖通商品接口

苹果Mac Finder 文件管理器替代工具:Path Finder

南屿

Path Finder破解 Path Finder下载 Mac文件管理

【Mac/win】Imagenomic Portraiture-PS磨皮插件-支持Ps2024 直装激活版

南屿

Imagenomic Professional PS磨皮滤镜降噪插件套装

适用于ipad/iphone的虚拟定位工具:FonesGo Location Changer

南屿

GPS Mac软件 FonesGo Location Changer

我的效率自救之路:大胆对低效的会议说“不!”

LigaAI

高效工作 经验分享 会议管理 研发提效 高绩效团队

国企财务管控模式的创新思路

智达方通

国企 国有企业 财务管控 国企财务管控

嘘!马斯克的话别全信

ZA技术社区

云服务 科技

解决Lightroom无法使用修改照片的问题

南屿

Lightroom无法使用

流式湖仓增强,Hologres + Flink构建企业级实时数仓

阿里云大数据AI技术

苹果OCR文字识别工具推荐:OCRKit Pro 中文破解版

mac大玩家j

Mac软件 识别工具

如何本地化部署青否数字人系统源码!

青否数字人

数字人

小红书笔记详情数据接口(smallredbook.item_get_video)丨小红书API接口

tbapi

小红书笔记详情接口 小红书API接口

人大金仓&恒生电子助力湘财证券TA系统国产化升级

科技热闻

微软专家:我们要使用人工智能构建人机接口,代替鼠标和键盘_AI&大模型_Ben Linders_InfoQ精选文章