内容目录
概念一:机器学习(Machine Learning)
:不是物理机器,可以理解为:平台、系统、软件、代码Machine
:一个平台/系统,经历了某些过程之后,性能或能力得到提升,这个过程就叫学习。Learning
机器学习的项目流程:
第一步:从宏观角度来分析问题,搞定输入和输出。
结合我们实际应用中会遇到的问题,其输入输出如下:
- 中英翻译器:
- 输入:中文
- 输出:英文
- 房价预测:
- 输入:房子
- 输出:价格
- 人脸检测:
- 输入:图像
- 输出:人脸
第二步:按照输入和输出,构建数据集
一般来说,数据集的构成形式:
- 一行一个样本,一列一个特征(其实是一个二维表)
- 前面放特征(输入),最后一个放标签(输出)
备注:在魔塔社区找了一份大众点评评价数据集,其内容即为一个表格,前面是特征,label为标签。
第三步:找一个机器学习算法,完成输入到输出的映射
这个过程一般来说是,其本质是完成从输入到输出的映射。
- 遴选一种算法
- 把数据给算法
- 完成算法的训练
- 模型评估
第四步:部署算法,工程集成即可
第五步:模型不断地迭代升级
概念二:算法和模型
:Algorithm,偏抽象的,计算机执行一个任务时,具体的执行步骤。算法
:model,具体的,把算法用代码实现出来,这就是模型模型
概念三:传统算法 VS 人工智能:
传统算法:rule-based algorithm 基于规则的算法
* 规则是人来定的
* 数学和计算机背景
* 复杂度:时间复杂度和空间复杂度很低,硬件要求低,执行速度快
* 效果:鲁棒性差,泛化能力极其弱小,解释性好
人工智能算法:data-based algorithm 基于数据的算法
* 从老数据中挖掘规律:训练(train)/学习(learn)/拟合(fit)
* 把规律作用于新数据:推理(infer)/泛化/预测(predict)/测试(test)
* 非常简单,人人可以学会
* 复杂度:时间复杂度和空间复杂度很高,硬件要求极高,执行速度极慢
* 效果:鲁棒性好,泛化能力极强,解释性差
数学知识:
人工智能需要以下数学知识的支撑:
- 高等数学:其是用来做优化的(梯度下降法)
- 概率论和数理统计:做建模思想
- 线性代数和矩阵论:高性能科学计算
欢迎关注公众号以获得最新的文章和新闻