您所在的位置:永利娱乐场注册>彩票分析>6合开彩神马-算法知识汇总:构成/学派/算法

6合开彩神马-算法知识汇总:构成/学派/算法

作者:admin

2020-01-11 17:27:50     

6合开彩神马-算法知识汇总:构成/学派/算法

6合开彩神马,如果你是一名产品经理,想知道算法的基本知识,你可以考虑阅读这篇文章。

机器学习是一种通过计算机程序重组信息和数据并使用算法优化自身性能的系统。搜索引擎、内容推荐、信息流、在线广告等一直是机器学习算法的传统应用领域。与此同时,机器学习的应用领域仍在扩大。

目前,许多产品和操作都需要围绕机器学习算法系统进行,这已经成为许多产品的核心竞争力。在这种背景下,为了更好地用算法逻辑迭代产品,理解机器学习算法的基本逻辑是非常必要的。

机器学习起初是一个学习过程。目前,机器学习已经实现了学习的基本逻辑。有些规律可以从过去的经验中提炼出来,应用到未来的场景中。

汤姆·米切尔在他的书《机器学习:

对于某些任务测试和性能指标测试,如果一个计算机程序的性能是通过测试自我提高的,那么我们称之为从测试中学习

在这个定义中,我们可以看到机器学习的几个关键点:任务(task T)、性能指数(performance metric P)和历史数据(experience E)。

对于某一类任务,不断从数据中学习以优化任务的性能指标是当前机器学习算法的核心逻辑。

机器学习系统由数据、算法模型、模型评估和计算结果组成。

机器学习系统的起点是数据。在计算结果被呈现给用户或系统之后,用户的行为数据将反馈数据,这些数据将被重新输入到模型中。这是机器学习的基本过程,如下图所示:

数据是机器学习系统的起点。建立机器学习系统的先决条件是系统有足够的数据来做出决策。

判断一个问题是否可以通过机器学习来解决取决于是否能够收集到足够的相关数据。

例如,所有用户对内容的浏览行为数据可用于判断特定用户的后续阅读偏好。用户的每一个浏览和点击行为数据都意味着个人偏好的表达,而其他相关用户的行为也可以作为推测该用户行为的基础。构建算法系统,需要从多个角度判断数据是否满足构建算法模型的要求。

在确认数据可以用来建立机器模型来解决业务问题之后,是时候建立模型了。在算法模型的构建中,最关键的一步是将问题抽象成机器学习能够处理的标准问题。机器学习算法通常对实际情况做出一些模型假设。这些假设包含一些有待确定的参数。机器学习模型是寻找符合实际情况的模型假设,并通过算法的迭代来确定合理的参数。

在了解业务和算法的基础上,模型构建过程会更加顺利,但没有评估,模型就无法顺利构建。一方面,模型评估相当于质量检查,以确保模型输出结果的质量,防止在线后出现明显的经验问题。同时,模型评价中发现的问题也是模型优化的重要依据。

模型评估完成后,机器学习模型的计算结果可以在线输出给用户。这些计算结果最终将在用户使用中得到验证。真实的在线数据将反映模型在线后的效果,这些在线数据也将成为后续机器学习模型迭代的数据,从而形成一个完整的信息闭环。

虽然不同的算法有不同的实现方法,但大多数机器学习算法基本上都是由这些模块组成的。

佩德罗·多明戈斯(Pedro domingos)在《终极算法》中将机器学习算法分为五个流派,基本涵盖了当前主流的机器学习算法。接下来,我们将介绍这五所学校的典型算法。

联结主义学派的主要思想是通过神经元之间的联系来推断知识。联结主义学派有点类似于大脑的逆向工程,希望通过训练人工神经网络来获得结果。这是目前最受欢迎的机器学习学校。神经网络和基于神经网络的深度学习属于联想学派。

人工神经网络是一种非线性学习算法,类似于生物神经元,由多个节点组成。神经网络中每个节点的名称也遵循生物学中神经网络的概念,也称为神经元(neuron)。生物神经元和算法神经元的结构如下图所示。

在生物神经网络中,神经刺激信号从多个树突的尖端收集,这些树突被处理成新的电信号并通过轴突传输。

人工神经网络也具有这样的结构,即多个参数在神经元中被处理并输出到下一个节点。每个节点使用sigmoid函数进行参数处理,如下所示:

在多层神经网络中,每个神经元通过该模式连续传输数据,并最终输出计算结果。下图显示了一个典型的人工神经网络。

这里将不描述具体的优化方法,感兴趣的读者可以查看相关材料。

值得一提的是,sigmoid函数是算法领域中非常常见的函数,它可以将无界变量映射到(0,1)。该函数的特点是在神经网络中使用了许多算法策略。正是因为节点使用这一功能,它们才能确保与各种类型的数据兼容。乙状结肠功能曲线如下:

基于该方法,可以构建不同类型的神经网络模型。由于神经网络模型与各种类型的数据兼容,因此在现实中得到广泛应用,包括在线信息发布系统、图像识别、机器翻译等。

当然,这样的算法也有明显的问题——该模型难以解释,并且需要大量数据。因此,神经网络算法适用于数据量大、算法解释要求低的业务。

象征主义通过训练可解释的规则来解决问题。象征主义者更加强调逻辑推理,用过去的数据训练一套规则引擎来预测和判断未来。决策树和许多基于决策树的机器学习算法属于符号学派。

决策树算法是一种典型的分类方法,也是数据挖掘中常用的算法之一。在决策中,归纳算法可以用来生成可读的决策规则,这些规则可以对所有可能的实例进行分类和预测。

决策树算法非常贴近人们的决策过程。人们的标准化工作实际上可以理解为决策树。

以产品经理访谈为例,阐述了决策树的模型框架。假设通过对话可以理解候选人的三个特征:决策能力得分、系统学习能力得分和合作能力得分。同时,假设可以通过这三个特征来判断候选人是否通过。那么这个决策过程可以如下图所示:

这是一个标准化的决策过程,决策树实际上是一种利用历史数据构造对未来实例自动做出决策的方法。核心是确定每个属性在决策树中的位置。

在决策树生成的整个过程中,它从根节点开始,为每个向下的分类选择信息增益率最大的节点,并通过迭代不断地生成决策树。为了防止过度拟合,还将使用特定的规则算法来修剪决策树,例如,指定用于生成子节点的最小信息增益率,并且如果该最小信息增益率小于特定值,则不会生成子节点。

决策树是多分类器常用的算法之一,许多机器学习算法将使用决策树模型来建立更高级的模型。与其他算法模型相比,决策树的决策过程更接近决策的实际情况,决策树形成的规则也有助于我们更深入地了解业务。

进化学派建立在遗传学和进化生物学的理论基础上。核心方法是构建算法的评价标准和进化方法,并在系统中不断迭代算法以获得最佳解。今年的强化学习是进化学派的代表。

近年来,机器学习的浪潮已经进入公众的视野,这与阿尔法狗战胜李世石和柯杰的消息有很大关系。许多人不知道的是,在击败柯杰之后,deepmind发布了新版人工智能alphago zero,这是强化学习的典型应用。

强化学习是一种通过不断与环境训练策略互动,反复试验的系统学习方式。在系统中,有必要建立一个能够与系统持续交互并判断系统每一个动作的环境。系统根据每个动作的奖惩信号(强化信号)不断调整最佳动作策略。下面是一个典型的信息交互图。

具体来说,在围棋场景中,每个游戏的结果和游戏中形势的变化都是系统的奖惩信号,每一步失败都是一个动作,虚拟游戏中的围棋规则就是系统环境。

目前,该算法在工业上有很多应用,如基于强化学习的推荐算法。在实际背景下,算法面临的环境往往是不确定的,不像围棋中的规则总是固定的。为了解决这个问题,算法需要将真实问题抽象到一个稳定的虚拟环境中,即形成一个仿真系统,这也是在真实条件下构造强化学习算法过程中最困难的一步。

仿真系统也不是新概念。所有的宇宙飞行器都需要测试空气动力学性能才能升入天堂。将使用风洞系统。风洞是对飞行中各种情况的模拟。算法系统需要构建这样一个在线风洞。

强化学习的缺点目前也很明显。该算法高度依赖于仿真系统的构建,应用场景有限。与此同时,它是复杂的和不可解释的,并且需要大量的资源。

然而,强化学习的学习过程与生物学的进化过程非常相似。人类的本质也是以生存和繁衍为目标,在地球环境中进化的高级智能。也许经过进一步的发展,强化学习真的能把机器学习推向更高的水平。

4.贝叶斯学派

贝叶斯学派专注于概率推理和用贝叶斯定理解决问题。贝叶斯定理的核心是利用先验概率推断后验概率,即通过新数据更新概率的原始估计。朴素贝叶斯算法是贝叶斯学派的典型算法,其典型应用是垃圾邮件过滤系统。

在介绍朴素贝叶斯算法之前,首先简要介绍下贝叶斯定理。贝叶斯定理是计算两个随机事件的条件概率变换方法的一个定理。例如,对于随机事件,贝叶斯定理的数学描述如下:

贝叶斯定理是构造朴素贝叶斯算法的基础。以下是在邮件过滤环境中对该算法的介绍:

如果我们已经有一批已知的垃圾邮件,我们就可以知道垃圾邮件的一些典型特征。接下来,如果我们事先知道一封电子邮件包含与垃圾邮件相似的特征,我们可以推断这封电子邮件很有可能是垃圾邮件。

围绕贝叶斯定理将开发许多算法,朴素贝叶斯就是其中的一个代表。贝叶斯算法也是一种罕见的可以应用于小规模数据的算法。掌握贝叶斯定理是数据和策略相关工作的重要工具。

类比学派的核心是最近邻法。通过相似性判断,可以利用邻居的已知数据来估计未知数据。一些传统的推荐算法是类比法的典型应用。类比学派的典型算法是潜在因素模型(lfm),该算法的最佳实践也在推荐系统中。

推荐算法的起点是用户的行为数据。如果用户和项目有更多的交互,行为就会更强。推荐算法是根据用户行为数据填写下表中的空白。这个表单实际上是“用户x对象”的矩阵。

当选择项目或内容时,我们根据我们的偏好是否匹配项目或内容来决定。

对于服装,有些人关心颜色,有些人关心风格,有些人关心色调,有些人关心价格。人们在选择时会考虑很多因素,每个因素都有一个心理预期的偏好范围。下表显示了“用户x偏好”的矩阵。

不同的项目或内容与这些偏好不一致。项目和这些偏好之间的一致程度也将形成“项目x偏好”矩阵,如下表所示:

总之,我们需要使用“用户x项目”矩阵来寻找构建“用户x偏好”矩阵和“项目x偏好”矩阵的方法。在获得这两个矩阵之后,可以使用线性加权和方法来计算用户和项目的推荐分数。

Lfm就是这样一种算法。通过随机梯度下降,构造了两个潜在因素矩阵,并利用该矩阵计算了空缺项的推荐值。如下所示,这是由上述数据形成的推荐结果。

在原始数据中,用户7和用户8相似,如下表所示:

从推荐结果来看,用户7和8的推荐结果分数也非常相似。结果如下:

本文介绍了机器学习算法的基本思想,并介绍了几种基本算法。算法的介绍主要基于思想。如果需要进一步研究,可以查询公共数据。

基于这些算法的比较,已经导出了各种算法。在实际应用中,许多算法经常被组合以获得更好的结果。

机器学习算法不能与模型假设分开,模型假设包含一些有待确定的参数。每个假设都是真实情况的抽象,每个参数都是模型的理想化处理。这些假设和参数使模型得以建立,也使模型不同于现实。

然而,这些“差异”的存在并不影响实际问题的解决。正如统计大师乔治·博克所说,“所有的模型都是错误的,但其中一些是有用的”。我们需要了解模型与现实之间差异的原因和影响范围,并据此判断模型的适用范围。

作为一名产品经理,有必要了解模型算法的基本原理。只有这样,业务理解才能更好地集成到算法系统中,否则它很容易成为算法的手动注释器和案例收集器。

为了介绍机器学习的知识,本文不可避免地涉及一些数学逻辑,也可能使许多产品经理感到难以阅读,但这只是机器学习的冰山一角。我们必须总是选择做正确的事情,而不是简单的事情。

产品经理需要站在科学技术和人文学科的交叉点上,所以对最新技术的基本了解是产品经理的唯一途径。

潘益铭,《公共数字:产品逻辑之美》。每个人都是产品经理的专栏作家。毕业于清华大学,畅销书《产品逻辑之美》的作者。他曾在几家互联网公司担任产品经理,在构建复杂系统方面有许多实践经验。

这篇文章最初发表于《人人都是产品经理》。未经允许禁止复制。

主题地图来自unsplash,基于cc0协议。

上一篇:国台办:今年“双十一”台湾地区购买金额增幅最大
下一篇:时隔1480天 LPL三支战队再次全部晋级八强
(责任编辑:admin)



Copyright 2018-2019 booexpress.com 永利娱乐场注册 Inc. All Rights Reserved.