数据越多,AI决策模型越脆弱
文章图片
文章图片
大数据文摘授权转载自AI科技评论
编译:戚路北
校对:维克多
数据是构建人工智能系统必需的关键基础设施 。数据在很大程度上决定了AI系统的性能、公平性、稳健性、安全性和可扩展性 。
那么 , 用足够多的数据训练而来的AI系统 , 能够做出正确的决策么?今年5月份 , medium上的Marianne Bellotti博主发表了一篇名为“AI正在解决错误问题的文章” 。在文章中 , 作者提出一个观点:在更多数据(信息)加持下 , 人类都不一定做出“合适决策” , 为什么要假设AI会表现更好呢?
为了论证这个观点 , 博主写道:
“在现实生活中 , 决策者往往为了节约成本而进行优化决策 。但决策毕竟是根据结果来判断好坏的 , 在正确分析的基础上还需要一点运气 。在结果出来之前 , 即使是在绝佳数据支持下最仔细、最彻底构建的策略也无法保证决策的绝对正确 。”
显然 , 这一观点的意思是:决策的过程与其说是对数据的客观分析 , 不如说是对风险和优先级的权衡 。
最后 , 基于上述观察 , 作者论证了这么一个观点:数据驱动的AI模型 , 在做决策时候 , 极易受到攻击 。
AI 的方向存在偏差
面对一个难题 , 分步骤、有条理的解决方案是值得肯定的 。有哪些假设?假设如何构建?需要解决的问题?如果这些假设不同 , 会解决不同的问题吗?想要解决的问题和结果之间有什么关系?以上这些子问题 , 对于决策过程异常重要 。
假设访问更多数据是决策者做出更好决策的关键 , 所以研究者希望喂给系统越多数据 , AI越好的做出决策 , 拥有更少的负面影响 。
在这一假设下 , 我们理所当然的认为:完美信息应该自动改善决策过程 。考虑到现实 , 这一假设是错误的 。因为 , 决策的过程更多是由决策者背后的政治决定 , 退一步讲 , 即使能够获得完美信息 , 它也会通过增加噪音水平而降低了决策质量 。
例如 , 人工智能可以正确识别内容 , 但基于该内容做出的决策在很大程度上受到用户和组织的规范和期望的影响 。
例如 , Facebook 的审核政策允许将某些敏感部位图片 PS 到“明星”身上 , 但禁止明星真实敏感部位图片露出 。在Facebook这个例子上 ,人类很容易理解利益相关者之间的关系如何使这种区分变得合理:一个是违反言论自由和公共评论的规范;另一个则没有 。
显然 , 当团队做出决策时 , 考虑到各个利益相关者及其激励因素 , 改进决策的最佳途径就不再是获取更多数据 , 而是需要加强利益相关者之间的沟通 。
这对于问题“从国家层面来看 , 为了提高AI的决策能力 , 是否需要花费数十亿美元来清理数据和增强数据传感器?”有了更好的回答 。
毕竟 , 美国国防部每年在员工身上花费11-150 亿美元 , 以求他们将数据处理成某种形式 。经过数十年的投资、监管和标准制定 , 我们今天与1970年时候的“计算机化的大脑(computerized brain)”提法相比 , 本质上并没提高多少 。然而 , 随着计算机越来越先进 , 人们也越来越沉迷数据 。
数据驱动的脆弱性
谈论数据质量的方式具有误导性 。我们谈到“干净”数据 , 就好像存在一种数据既准确(且无偏差)又可重用的状态 。其实 , 干净与准确不同 , 准确与可操作又不同 。而无论哪种类型的数据出现问题 , 都有可能阻碍AI模型的开发 , 或者影响AI模型做决策 。
数据出问题的方式有很多 , 例如:数据实际上不正确、已损坏或采用错误格式 。还有些更微妙的错误:数据是在特定上下文中获取的 , 但重用的时候不恰当;数据没有标准化导致相同的事情 , 表达方式不一;对于模型来说数据处于错误的粒度级别......
- canalys公布2021年全球个人电脑市场数据
- 七款新品集中亮相,数说故事超前布局「数据驱动+AI 赋能」应用闭环
- 一纵一横,搭建完整数据分析体系
- 精灵魔塔数据互不互通(精灵魔塔ios安卓互通问题说明)
- 复苏的魔女官服和渠道服可以互通吗(复苏的魔女游戏数据互通问题说明)
- 上海空调清洗消毒大数据平台全新升级
- 杭州亚运会官方智能物联及大数据服务赞助商签约发布
- 摸金校尉之九幽将军安卓和苹果互通吗(摸金校尉之九幽将军安卓与ios数据互通问题讲解)
- 梦幻新诛仙好看的捏脸数据有哪些(梦幻新诛仙好看的捏脸数据汇总)
- 惟客数据解读:酒店业如何通过数字化战略布局实现逆袭与突围?
