9 3 虚拟遗憾最小化算法

Описание к видео 9 3 虚拟遗憾最小化算法

01人工智能概述
介绍可计算思想推动人类进入自动计算时代的历史脉络,了解希尔伯特“算术公理的相容性”、哥德尔“不完备性定理”、图灵机模型等概念,掌握以符号主义为核心的逻辑推理、以问题求解为核心的探询搜索、以数据驱动为核心的机器学习、以行为主义为核心的强化学习等方法的基本思路,从数据智能角度掌握人工智能所涵盖内容。
课时
1.1 可计算思想起源与发展
1.2 人工智能的发展简史
1.3人工智能研究的基本内容
02
搜索求解
现实世界中许多问题都可以通过搜索的方法来求解,例如最佳出行线路的计算推荐或是寻找合理安排的课程表。搜索是人工智能求解中的一种主要技术,其依据已有信息来寻找满足约束条件的待求解问题答案。了解和掌握贪婪最佳优先搜索、A*搜索等有信息搜索算法和模型,了解和掌握最小最大搜索(Minimax Search)、Alpha-Beta剪枝搜索(Pruning Search)和蒙特卡洛树搜索(Monte-Carlo Tree Search)等对抗搜索模型和算法。
课时
2.1 启发式搜索
2.2 对抗搜索(Minimax搜索、Alpha-Beta剪枝搜索)
2.3 蒙特卡洛树搜索(多臂赌博机、UCB算法和UCT算法)
03
逻辑与推理
逻辑与推理是人工智能的核心问题。人类思维活动的一个重要功能是逻辑推理,即通过归纳和演绎等手段对现有观测现象由果溯因(归纳)或由因溯果(推理),进行分析,得出判断。了解和掌握命题逻辑和谓词逻辑的推理模型、基于知识图谱推理的算法和模型(FOIL和路径排序等)以及基于结构因果模型(structural causal model, SCM)和因果图(causal diagram)的算法和模型。
课时
3.1 命题逻辑
3.2 谓词逻辑
3.3 知识图谱推理(一阶归纳推理、路径排序推理)
3.4 因果推理(辛普森悖论、D-分离、do算子)
04
统计机器学习:监督学习
统计机器学习是一种“数据驱动学习(data-driven learning)”的范式。监督学习方法需要标注数据才能完成,因此叫监督学习(supervised learning)。统计学家、Fisher判别函数表达式的提出者Ronald Aylmer Fisher曾经讲过,统计分析的目的是“化繁为简(the object of statistical methods is the reduction of data)”。了解机器学习的基本概念(如评价函数、结构风险最小等),掌握监督学习的基本模型和算法(线性回归、Ada Boosting和线性区别分析等)。
课时
4.1 机器学习基本概念
4.2 线性回归分析
4.3 Ada Boosting
4.4 线性区别分析
05
统计机器学习:无监督学习
无监督学习的目的是从没有标签的数据中挖掘数据所蕴含模式,进行预测、识别和分类等任务。无监督学习本质是学习数据的分布,使得数据实现“物以类聚,人以群分”的归属。了解和掌握无监督学习的基本模型和算法,包括K均值聚类、主成分分析、特征人脸方法和期望极大算法(EM)等。
课时
5.1 K-means
5.2 主成份分析
5.3 特征人脸方法
5.4 期望极大算法(Expectation Maximization,EM)
06
深度学习
深度学习是目前人工智能在特定领域、特定任务中获得成功的一种基本模型。在标注大数据驱动下,深度学习模型通过误差后向传播来自动调节模型参数、优化模型,架构起“端到端”学习机制。了解深度学习的基本思想、模型和算法,包括感知机模型、前馈神经网络、卷积神经网络及相关算法(误差后向传播、提度下降等),了解深度模型在自然语言(词向量生成)和计算机视觉(分类与视觉对象定位)等方面的应用。
课时
6.1 前馈神经网络(误差后向传播)
6.2 卷积神经网络
6.3 自然语言理解与视觉分析
07
强化学习
强化学习可帮助智能体在与环境交互过程中,从反馈中调整策略,“屡战屡败、屡败屡战”,最后完成学习任务,学习得到应对环境和完成任务的最优策略。了解和掌握强化学习的基本思想、算法和模型,包括马尔科夫决策过程、策略优化和评估、Q-learning以及深度学习和强化学习相结合的深度强化学习模型。
课时
7.1 马尔科夫决策过程
7.2 强化学习中策略优化与策略评估
7.3 Q-Learning
7.4 深度强化学习
08
人工智能博弈
博弈行为是多个带有相互竞争性质的智能体,为达到各自目标和利益,采取的带有对抗性质的行为,即“两害相权取其轻,两利相权取其重”。博弈是健壮人工智能所需内在秉性。了解和掌握人工智能博弈方面的基本思想、算法和模型等,包括纳什均衡、遗憾最小化和虚拟遗憾最小化等算法。
课时
8.1 博弈相关概念 (纳什均衡)
8.2 遗憾最小化算法
8.3 虚拟遗憾最小化算法

Комментарии

Информация по комментариям в разработке