内容目录

概念一:机器学习(Machine Learning)

  • Machine:不是物理机器,可以理解为:平台、系统、软件、代码
  • Learning:一个平台/系统,经历了某些过程之后,性能或能力得到提升,这个过程就叫学习

机器学习的项目流程:

file

第一步:从宏观角度来分析问题,搞定输入和输出。

结合我们实际应用中会遇到的问题,其输入输出如下:

  • 中英翻译器:
    • 输入:中文
    • 输出:英文
  • 房价预测:
    • 输入:房子
    • 输出:价格
  • 人脸检测:
    • 输入:图像
    • 输出:人脸

第二步:按照输入和输出,构建数据集

一般来说,数据集的构成形式:

  • 一行一个样本,一列一个特征(其实是一个二维表)
  • 前面放特征(输入),最后一个放标签(输出)

备注:在魔塔社区找了一份大众点评评价数据集,其内容即为一个表格,前面是特征,label为标签。
file

第三步:找一个机器学习算法,完成输入到输出的映射

这个过程一般来说是,其本质是完成从输入到输出的映射。

  • 遴选一种算法
  • 把数据给算法
  • 完成算法的训练
  • 模型评估

file

第四步:部署算法,工程集成即可

第五步:模型不断地迭代升级

概念二:算法和模型

  • 算法:Algorithm,偏抽象的,计算机执行一个任务时,具体的执行步骤。
  • 模型:model,具体的,把算法用代码实现出来,这就是模型

概念三:传统算法 VS 人工智能:

传统算法:rule-based algorithm  基于规则的算法

* 规则是人来定的
* 数学和计算机背景
* 复杂度:时间复杂度和空间复杂度很低,硬件要求低,执行速度快
* 效果:鲁棒性差,泛化能力极其弱小,解释性好

人工智能算法:data-based algorithm 基于数据的算法

* 从老数据中挖掘规律:训练(train)/学习(learn)/拟合(fit)
* 把规律作用于新数据:推理(infer)/泛化/预测(predict)/测试(test)
* 非常简单,人人可以学会
* 复杂度:时间复杂度和空间复杂度很高,硬件要求极高,执行速度极慢
* 效果:鲁棒性好,泛化能力极强,解释性差

数学知识:

人工智能需要以下数学知识的支撑:

  • 高等数学:其是用来做优化的(梯度下降法)
  • 概率论和数理统计:做建模思想
  • 线性代数和矩阵论:高性能科学计算

发表评论

您的电子邮箱地址不会被公开。 必填项已用 * 标注

分类文章

personal_logo
Dongming
自由职业者

推荐活动

推荐文章

【项目实战】基于Agent的金融问答系统:RAG的检索增强之上下文重排和压缩
【项目实战】基于Agent的金融问答系统:RAG的检索增强之ElasticSearch
【项目实战】基于Agent的金融问答系统:前后端流程打通
【项目实战】基于Agent的金融问答系统:代码重构
【项目实战】基于Agent的金融问答系统:Agent框架的构建
【项目实战】基于Agent的金融问答系统:RAG检索模块初建成
【项目实战】基于Agent的金融问答系统:项目简介
【课程总结】day29:大模型之深入了解Retrievers解析器
【课程总结】day28:大模型之深入探索RAG流程
【课程总结】day30:大模型之Agent的初步了解
内容目录
滚动至顶部