当前位置 博文首页 > xpj8888的博客:第一周 机器学习(ML)策略(1):1.8 为什么是

    xpj8888的博客:第一周 机器学习(ML)策略(1):1.8 为什么是

    作者:[db:作者] 时间:2021-09-17 21:18

    目录

    第一章、简介

    第二章、AI智能与人类智能的对比

    2.1、AI智能与人能行为的比较

    2.2、AI智能可达到的理论水平(贝叶斯最优误差)

    2.3、举例说明AI智能为什么不可超越理论水平

    2.4、在AI智能低于人类水平情况下,有三种策略可以提升AI智能。


    第一章、简介

    ?

    • 本文基于吴恩达人工智能课程做学习笔记、并融入自己的见解(若打不开请复制到浏览器中打开)https://study.163.com/courses-search?keyword=吴恩达。
    • 本文的标题是源标题“1.8 为什么是人的表现”。虽然觉得标题 无法体现本文的主旨,但我还是保留源标题。
    • 所以,在本文第二章自己拟建了一个章节标题,将介绍 AI智能与人类智能的对比。

    ?

    第二章、AI智能与人类智能的对比

    ?

    2.1、AI智能与人能行为的比较

    ?

    • 在过去的几年里,更多的机器学习团队一直在讨论,如何比较机器学习系统和人类的表现,为什么呢?我认为有两个主要原因,首先是因为深度学习系统的进步,机器学习算法突然变得更好了,在许多机器学习的应用领域已经开始见到算法已经可以威胁到人类的表现了。
    • 其次,事实证明当你试图让机器做人类能做的事情时,可以精心设计机器学习系统的工作流程,让工作流程效率更高。
    • 所以,我们很自然地在某些场合比较人类和机器的行为,或者你要让机器模仿人类的行为。

    ?

    2.2、AI智能可达到的理论水平(贝叶斯最优误差)

    ?

    • 我们来看几个这样的例子,我看到很多机器学习任务中,当你在一个问题上付出了很多时间之后。
    • 图2-1中,x 轴是时间,可能是几个月甚至是很多年。在这些时间里 一些团队或一些研究小组正在研究一个问题。
    • 当你开始往人类水平努力时,进展是很快的。但是过了一段时间,当这个算法表现比人类更好时,那么进展和精确度的提升就变得更慢了。
    • 也许它还会越来越好,在超越人类水平之后它还可以变得更好。但性能增速、准确度上升的速度会变得越来越平缓。
    • 我们都希望能达到理论最佳性能水平,随着时间的推移,当您继续训练算法时,可能模型越来越, 数据越来越多,但是性能无法超过某个理论上限,这就是所谓的贝叶斯最优错误率(Bayes optimal error)。

    ?

    ?

    ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?图 2-1

    ?

    2.3、举例说明AI智能为什么不可超越理论水平

    ?

    • 所以认为贝叶斯最优误差,一般是理论上可能达到的最优错误率。
    • 就是说没有任何办法设计出,一个 x 到 y 的函数 让它能够超过图2-1中的虚线2。
    • 例如,对于语音识别来说,如果 x 是音频片段,有些音频就是这么嘈杂,基本不可能知道说的是什么。所以音频完美的准确率可能不是 100%。
    • 或者对于猫图识别来说,也许一些图像非常模糊,不管是人类还是机器,都无法判断该图片中是否有猫。所以完美的准确度可能不是 100%。
    • 贝叶斯最优错误率有时写作Bayesian optimal error或者Bayesian error,就是从 x 到 y 映射的理论最优函数,永远不会被超越图2-1中的虚线2。
    • 所以你们应该不会感到意外这紫色线,无论你在一个问题上工作多少年,你永远不会超越贝叶斯最佳误差(或 叶斯最优错误率)。
    • 事实证明,机器学习的进展往往相当快,直到你超越人类的表现之前一直很快。当你超越人类的表现时,有时进展会变慢。
    • 我认为有两个原因,为什么当你超越人类的表现时进展会慢下来——一个原因是人类水平在很多任务中,离贝叶斯最优错误率已经不远了,人们非常擅长看图像,分辨里面有没有猫或者听写音频。(很多任务中,人类水平与AI差异性较小,故此时无需要AI帮忙)
    • 所以,当你超越人类的表现之后,也许没有太多的空间继续改善了,但第二个原因是,只要你的表现比人类的表现更差,那么实际上可以使用某些工具来提高性能,一旦你超越了人类的表现,这些工具就没那么好用了。(很多任务中,工具无法一直优化AI性能,故AI性能难以继续提升)

    ?

    2.4、在AI智能低于人类水平情况下,有三种策略可以提升AI智能。

    ?

    • 我的意思是这样,对于人类相当擅长的任务,包括看图识别事物 听写音频,或阅读语言,人类一般很擅长处理这些自然数据。
    • 对于人类擅长的任务,只要你的机器学习算法比人类差,你就可以从让人帮你标记数据,你可以让人帮忙或者花钱请人帮你标记例子,这样你就有更多的数据可以喂给学习算法(策略一,标记数据给AI算法使用)
    • 下周我们会讨论人工误差分析,但只要人类的表现比任何其他算法都要好,你就可以让人类看看你算法处理的例子,知道错误出在哪里,并尝试了解为什么人能做对、算法做错(策略二,人工误差分析,弄明白人类分析为什么比AI算法好)。
    • 下周我们会看到这样做有助于提高算法的性能,你也可以更好地分析偏差和方差,我们稍后会谈一谈(策略三,分析偏差和方差)。
    • 但是只要你的算法仍然比人类糟糕,你就有这些重要策略可以改善算法,而一旦你的算法做得比人类好,这三种策略就很难利用了。
    • 所以这可能是另一个,和人类表现比较的好处,特别是在人类做得很好的任务上,为什么机器学习算法往往很擅长模仿人类能做的事情,然后赶上甚至超越人类的表现。
    • 特别是即使你知道偏差是多少、方差是多少,知道人类在特定任务上能做多好,可以帮助你更好地了解你应该重点尝试减少偏差还是减少方差,我想在下一个视频中给你一个例子。
    cs