AI研究方向努力更重要!

高章舜_2020首次发布:2023年9月21日 14:32浏览量:1176
 用鼠标选中 生字  后,就能自动读出发音 

35年前1988年4月,李开复使用统计方法进行语音识别,完胜专家系统方法!

26年前1997年举办国际象棋人机大赛,AI使用深度统计方法打败人类冠军,再次说明AI使用统计方法模仿 人类思考行为 更有效!

详情,见下面两篇文章。

第一篇AI文章李开复2017年8月16日自述

1983-1988年,正在卡内基·梅隆大学读计算机博士

正忙着暑期教书,秋天投身奥赛罗人机博弈。这一种黑白棋游戏,正是这种游戏 机器第一次 真正意义打败人类冠军。

导师瑞迪教授Raj Reddy,图灵奖得主、卡内基梅隆大学计算机系终身教授、美国工程院院士,从美国国防部得到300万美元经费,用来做 不指定语者、大词库、连续性语音识别。

瑞迪教授希望机器能听懂 任何人声音,而且 可以懂 上千个词汇,懂人们自然连续 说出每一句话。

计划采用专家系统完成项目,因为这个方法 需要数据不多。

专家系统早期人工智能一个重要分支,可以把看作一类具有专门知识经验计算机智能程序系统,一般采用人工智能中知识表示知识推理技术模拟 通常由领域专家才能解决复杂问题。

这个语音识别项目,不认同专家系统相信收集大量相关数据,建立大型数据库,然后对大语音数据库 进行分类,有可能解决专家系统不能解决问题。

再三思考鼓足勇气,向瑞迪教授直接表达 想法。瑞迪说:希望 转投统计学,用统计学解决这个“不特定语者、大词汇、连续性语音识别”。

瑞迪教授耐心听完激情回答,用那永远温和声音 告诉:“开复专家系统统计观点,不同意,但是可以支持你 用统计方法去做,因为相信科学 没有绝对对错,我们都是平等。而且,更相信一个有激情可能找到 更好解决方案”。

那一刻,感动 无以伦比。因为对一个教授来说,学生要用自己方法作出一个唱反调研究。教授不但没有动怒,还给予充分支持,这很多地方不可想象

1987年5月,我们大幅度提升训练数据库,采用建模方法,不但能够 用统计学方法学习 每一个音,而且可以用统计学方法学习 每两个音之间转折。针对 有些音样本不够,又想出一种generalized triphones方法合并 其他音。这三项工作 居然把机器语音识别率原来40%提高到了80%!后来又提高96%。这个成果撼动整个学术领域,这不仅当时计算机领域最顶尖科学成果,更铸就当代语音识别技术。

至此,统计学方法用于语音识别初步被验证正确方向,大家都相信机器学习方法隐马可夫模型算法,并且抛弃不可行专家系统方法,专家系统方法只能做到60%识别率。

从此,所有专家系统研究语音识别人 全部转向统计方法

后来,《商业周刊》把发明选1988年最重要科学发明。

第2篇AI文章:人工智能研究,惨痛教训

Richard Sutton,2019年3月13日

翻译:高章舜,2023年9月20日

长达70年人工智能研究可以得出最大教训,利用算力方法最终最有效。最终原因摩尔定律,或者更确切地说,摩尔定律单位计算成本持续快速下降归纳总结。大多数人工智能研究,都假设所需算力恒定情况下进行。因此这种情况,利用人类知识提高性能唯一方法。但是,AI研究项目耗时稍长一点,就不可避免地需要消耗更多算力。为了在短期内 改进,研究人员 试图利用他们该领域人类知识。但长远来看,唯一重要的是利用算力。这两者不一定矛盾,但实际上它们往往对立。花在前者时间 就不能花后者身上。而使用人类知识方法往往使 方法复杂化,这种方法 比不上利用算力方法,后者 更通用。人工智能研究人员 很晚才发现这一点,教训惨痛,现在盘点一下有益

国际象棋“人机大战”领域,1997年 击败世界冠军卡斯帕罗夫方法基于大规模深度搜索。当时,大多数计算机国际象棋研究人员 对此感到郁闷,他们一直寻求利用人类国际象棋特殊结构理解这一方法。当一种使用特殊硬件软件更简单、基于搜索方法 被证明更有效,这些基于人类知识国际象棋研究人员 并不认输。他们说,靠算力“蛮力”搜索 可能这次赢,但这不是 一种通用策略,无论如何,这不是 人们下棋方式。这些研究人员 希望基于人类知识方法能够获胜,但结果却是:又一次失败。

围棋“人机大战”领域出现类似研究模式,只不过20年以后。通过利用人类知识比赛特点避免海量搜索,这样做结果:投入巨大,但没有效果;尤其深度搜索被大规模地证明有效之后。尽管自我学习1997年首次击败世界冠军程序没有发挥重要作用,但后来可以使用自我学习学习价值函数,这一点更为重要。通过比赛自我学习,以及一般学习,就像搜索一样,可以进行 大量计算。搜索学习人工智能研究中 使用大量计算两种最重要技术。围棋“人机大战”中,就像国际象棋“人机大战”中一样,AI研究人员最初努力利用人类知识理解,以避免 使用搜索,直到很久以后使用搜索学习才战胜人类选手,取得更大成功。

语音识别 领域,早20世纪70年代 就有一个由DARPA赞助竞赛。参赛者 包括一系列利用人类知识方法 — 单词、音素、人类发声知识等。另一方法使用马尔可夫模型(hmm)新方法,这个方法本质上更偏向于统计,需要进行更多计算。统计方法基于人类知识方法更有效。这导致整个自然语言处理领域重大变化,几十年时间统计计算逐渐主导这个领域。最近深度学习语音识别领域兴起朝着这个方向迈出最新一步。深度学习方法知识依赖更少,但使用更多算力,以及庞大训练集学习,产生更好语音识别效果。就像比赛一样,AI研究人员总是 试图让计算机识别系统 按照研究人员思维方式运行 — 他们试图 将这些知识放入系统中 — 但这适得其反,而且浪费研究人员 大量时间。因为通过摩尔定律,大规模计算越来越可行,找到一种方法充分利用这些强有力算力

计算机视觉领域,有类似模式。早期方法将视觉设想搜索边缘、或广义圆柱体、或SIFT特征。但今天,早就不用这些方法。现代深度学习神经网络只使用卷积某些不变式,并且表现得更好。

这教训够大,我们还没有完全了解 这一领域,我们犯同样错误。为了看到 这一点,我们必须理解 这些错误如何发生我们必须吸取 痛苦教训,从长远来看,人类知识思维方式AI走不通。痛苦教训基于历史观察:

1)人工智能研究人员 经常试图将知识构建他们AI系统中

2)这总是在短期内 有所帮助,并且使研究人员个人满意

3)从长远来看,会停滞不前,甚至会抑制进一步进展

4)突破性进展 最终会通过基于搜索学习可伸缩计算方法实现。

最终成功苦涩,而且往往不能完全理解,因为违反普通人认知。

我们应该这个惨痛教训中学到的一件事是 通用方法强大,这些方法 随着计算量增加而不断扩展。这种情况下,有两种方法似乎可以按需扩展:搜索学习

从痛苦中学到的第二个教训,思想实际极其复杂我们不该用偷懒方法考虑思想内含,这些偷懒方法如:仅仅考虑空间、物体、多个AI系统或简单对称性,它们只是随意、复杂外部世界一小部分,它们不应该被内置,因为它们复杂性无限;相反,我们应该只构建能够发现捕获这种复杂性高一层次方法。通过这些方法,可以找到很好近似值,但它们搜索应该由我们方法,而不是我们自己。我们希望人工智能系统能够像我们一样 去发现,而不是发现我们已经知道东西。

英语原文:www.incompleteideas.net/IncIdeas/BitterLesson.html


最新修改时间:2023年9月22日 15:16
前一篇:

后一篇:

您已浏览完毕。

高章舜,软考技术支持专家、中文“智能文”发明者、中文智能化推进者。其EMAIL是:gaozhsh2007@sina.com

高章舜主持开发的中文智能编辑系统,呈现了中文“智能体”的优美。为了发扬光大中文的优秀传统,弘扬文化自信,著作人决定第一版开源,向全社会开放本版本的使用权。如果您需要更清晰、更优美、更专业、手写体更丰富的文章格式,甚至还需要定制字体和文章格式的话,请按上一段里的EMAIL给高章舜老师发邮件。


登录后回复

共有0条评论


copy right www.zhutu.net 回首页