分类目录归档:机器学习

拉格朗日乘法解决约束条件下的最优问题


拉格朗日乘数法

寻找变量受一个或多个条件所限制的多元函数极 值方法。将n个变量和k个约束的最优问题转换为 n+k变量的方程组极值问题,变量没有约束。

拉格朗日乘数:约束方法梯度的线性组合中各向量的系数(法向量的系数)


用拉格朗日乘法解决约束条件下的最优问题

二元类型

目标函数:

$$ f(x,y) = x^2+4y^2 -2x+8y $$

约束条件: $$ x+2*y=7 $$

最优问题:在约束条件下找目标函数f(x,y)的最小值

几何问题:目标函数为一个椭圆,约束条件为直线,最优问题在几何上表现为,椭圆经过放大后和直线相交情况下最小面积。

  1. 确认目标函数
  2. 确认约束函数 $$

Read more

挖掘导演最爱用的演员 关联规则-FPGrowph


挖掘导演最爱用的演员 关联规则-FPGrowph

概要

Aprior

和Apriori比较

FP的全称是Frequent Pattern,在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。

Apriori算法是常用的用于挖掘出数据关联规则的算法,它用来找出数据值中频繁出现的数据集合,找出这些集合的模式有助于我们做一些决策。比如在常见的超市购物数据集,或者电商的网购数据集中,如果我们找到了频繁出现的数据集,那么对于超市,我们可以优化产品的位置

Read more

朴素贝叶斯概览


分类,概率统计

  1. 条件概率

事件A在事件B发生的条件下的概率

$$ P(A|B)=\frac{P(AB)}{P(B)} $$

2.乘法公式

P(AB)=P(B)P(A|B)=P(A)P(B|A)

n>=2

p(A_1A_2**A_n)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)...P(A_n|A_1A_2...A_n1

3.全概率

如果事件组B1,B2,.... 满足 1. B1,B2....两两互斥,即 Bi ∩ Bj = ∅ ,i≠j , i,j=1,2,....,且P(Bi)>0,i=1,2,....; 2. B1∪B2∪....=Ω ,则称事

Read more

时间序列预测ARIMR(Spark scala,Python)


  1. 概要
  2. 平稳性
  3. 回归模型
  4. 自回归模型
  5. 滑动平均模型
  6. 自回归移动平均结合模型
  7. 差分法
  8. 差分移动平均自回归模型
  9. ARIMA计算步骤

1.概要

ARIMA模型由Box与Jenkins于上世纪七十年代提出,是一种著名的时间序列预测方法。ARIMA的含义是单积自回归移动平均过程,其含义为:假设一个随机过程含有d个单位根,其经过d次差分后可以变换为一个平稳的自回归移动平均过程,则该随机过程称为单积(整)自回归移动平均过程。

  • 名称解读

    AR: 自回归模型   Autoregressive model
    I : 差分        
    MA: 滑动平均模型 Moving average model
    

Read more