课堂笔记:吴恩达的AI课(AI FOR EVERYONE)-W2 AI项目工作流程
一、如何开始一个AI项目?
1、建设项目工作流程
2、选择合适的AI项目
3、为这个项目收集数据和组织团队
二、AI项目的工作流程
(1)机器学习项目的关键步骤:示例1:以亚马逊的语音助手 Echo/Alexa为例
①收集数据
②训练模型:迭代这个模型,直到达到足够好的效果
③部署模型:获取反馈,持续优化模型
(2)机器学习的关键步骤:示例2:以自动驾驶为例
①收集数据:图片,例如图片中其他车的位置
②训练模型:不停地迭代,直到获取到足够好的效果
③部署模型:获取反馈数据,持续优化模型
(3)数据科学项目的关键步骤:示例1:优化销售模式
①收集数据:例如用户ID,国家,时间和网址等
②分析数据:不停地迭代职高获得更好的效果
③输出建议或者行动:实施这些变化,重新分析新的数据
(4)数据科学项目的关键步骤:示例2:以工厂手工线体为例
以做咖啡杯为例,不同供应商提供的黏土哪个更好?
①收集数据:例如,加班时间,需要的温度,灼烧的时间等
②分析数据:不停地迭代直到获得更好的洞察
③输出建议或者行动:实施这些变化,重新分析新的数据
三、各职能部门对于数据应用能力的建设
(1)对于销售来说:
①数据科学:优化销售数据漏斗;
②机器学习:自动排序客户优先级;
(2)手工线体管理:
①数据科学:优化线体效率
②机器学习:自动识别优劣品
(3)招聘:
①数据科学:优化招聘漏斗;
②机器学习:自动化建立筛选;
(4)市场:
①数据科学:A、B测试;
②机器学习:定制化产品推荐;
(5)农业:
①数据科学:种子分析;
②机器学习:精准除草;
四、如何选择人工智能项目
(1)AI知识和领域知识
①AI专家负责知道AI可以做什么;
②领域专家 知道 这个事情的商业价值;
③所以AI项目团队是跨领域的项目团队,既要有AI专家,又要有领域专家;
(2)头脑风暴的框架:
①思考要任务化,而非岗位化,例如呼叫中心的具体任务,或者放射科的具体任务;
②驱动这件事情的最主要的业务价值是什么?
③做这个事情的最大的痛点是什么?
(3)你可以做一些事情,即使没有大量的数据
①有非常多的数据,这件事没有害处;
②数据能让某些业务(比如网页搜索)具备竞争壁垒。
③但即便只有小数据集,你仍能取得进展。
五、如何选择人工智能项目2
(1)项目的一些工作侧重点
①技术工作侧重点:
a.人工智能系统能否达到预期性能;
b.需要多少数据;
c.工程时间安排;
②业务工作侧重点:
a.更低的成本
b.增长的收益
c.启动新的产品或者业务
其中,a和b针对的是现有的业务,c是针对新业务;
(2)自研 还是 外包?
①机器学习项目可以自研或者外包;
②数据科学项目大多数是自研的;
③一些事情已经有了行业标准,那么我们要避免自研这些事情;
一句通俗的话,我们不要在火车前面奔跑;
行业发展十分迅速,我们不应该去对抗,或者一心求着去快速赶超或者制造行业标准,获取我们拥抱行业标准,才会更快更好的实现价值;
六、人工智能团队协作机制
(1)明确你的验收标准:
①目标:以 95% 的准确率检测缺陷;
②向人工智能团队提供一个数据集,用于衡量其性能;
(2)AI团队应该如何看待数据?
①训练集:用于训练模型;
②测试集:用于测试模型;
(3)陷阱:期望达到 100% 准确率
① 测试集;
② 机器学习的局限性;
③ 数据不足;
④ 数据标注错误;
⑤ 标签模糊;
七、人工智能团队技术工具
(1)一些开源框架:
①机器学习框架:
a.PyTorch
b.TensorFlow(张量流 )
c.Hugging Face(拥抱脸,知名机器学习模型库 )
d.PaddlePaddle(飞桨 )
e.Scikit - learn(科学工具包 - 学习 )
f.R(编程语言 )
②研究出版物平台:
Arxiv(预印本平台 ,常用于分享学术研究成果 )
③开源代码库:
GitHub
(2)CPU 和 GPU
①CPU:计算机处理器(中央处理单元)
②GPU:图像处理器
(3)云、本地部署和边缘部署
①云部署:线上部署代码,现在的趋势;
②本地部署:在本地服务器上部署代码;
③边缘部署:在各个终端部署代码,可以更加便捷的获取终端数据;