一,关于分类问题及其损失函数的一些讨论。

在构建分类模型是,我们的最后一层往往是softmax函数(起到归一化的作用),如果是二分类问题也可以用sigmoid函数。
 

在loss函数的选择上,一般采用交叉熵损失函数(cross-entropy),为什么呢?因为交叉熵损失函数更容易使得optimisization到达低loss(如下图:cross-entropy的梯度图更为陡)

 

二,对于Adam和SGDM梯度优化算法的比较

Adam:训练速度很快,但是收敛效果不佳

SGDM:训练速度平稳,收敛性较好

SWATS算法:Adam和SGDM算法的结合:(训练开始用Adam,在收敛时用SGDM) 

注意:使用Adam算法初始不稳定,需要进行预加热(Warm up) .

三,Radam算法与SWATS算法比较:
 

后面就有点听不懂了,以后了解更多再来听吧,做个记号。
(选修)To Learn More - Optimization for Deep Learning (2_2)_哔哩哔哩_bilibili 
笔记先做到这hh,有的笨,当先了解了。

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/diannao/91489.shtml
繁体地址,请注明出处:http://hk.pswp.cn/diannao/91489.shtml
英文地址,请注明出处:http://en.pswp.cn/diannao/91489.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Python绑定及其在Mujoco仿真器中的作用

好的,这是一个非常核心且重要的问题。我来分两部分为你详细解释:首先是“什么是Python绑定”,然后是“它在MuJoCo中具体的作用”。第一部分:什么是Python绑定 (Python Binding)? 简单来说,Python绑定是一座…

数学建模从入门到国奖——备赛规划优秀论文学习方法

数学建模从入门到国奖——备赛规划 数学建模国一:我的逆袭经验分享在大二,我们团队初次参加妈妈杯,遗憾未获奖,后来经过5个月的时间,在大三上学期的9月,我们团队以C题数据挖掘机器学习创新斩获国赛一等奖&a…

大型语言模型的白日梦循环

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领…

【Gaussian Haircut论文】在Deepseek和Chatgpt的帮助下慢速了解核心方法

3.Method 一、 1.核心目标 输入:多张从不同角度拍摄的头发照片。输出:3D发型模型,且模型由发丝构成(即每根头发被建模为独立的曲线/线段,而非体积/网络)。 2.数据预处理 在正式重建前,需要从输入…

众趣SDK重磅升级:空间物联IOT新视界,赋能实景三维场景深度应用

近日,空间数字孪生云服务行业领导者—众趣科技宣布旗下核心产品云服务平台Qverse SDK迎来里程碑式升级!本次升级聚焦行业前沿需求,重磅推出IoT设备监控系统、iframe跨平台页面无缝集成、BI数据智能三大解决方案,旨在将三维空间计算…

021_自然语言处理应用

自然语言处理应用 目录 NLP应用概述文本理解技术文本生成应用语言分析工具多语言处理专业领域应用实践案例 NLP应用概述 核心能力范围 文本理解 语义理解:深度理解文本含义和上下文实体识别:识别人名、地名、机构名等命名实体关系提取:…

小程序中状态管理Redux

Redux 是一个 集中式 状态管理框架,所有状态存储在一个 全局 Store 中,并通过 Action 触发 Reducer 进行数据更新。。1.安装npm install redux miniprogram-computed2.创建// store.js import { createStore } from "redux";// 定义初始状态 c…

c++:类型转换函数

简介 在C++中,类型转换运算符(也称为类型转换函数或转换函数)是一种特殊的成员函数,它允许将一个类类型的对象转换为其他类型。转换运算符的声明形式如下: operator type() const; 关键点 ​​声明​​:在类内部声明,没有返回类型(因为type已经表示了返回类型),没…

Java 8 jdk1.8下载及安装教程和环境变量配置

1. 概述 本文介绍如何在 Windows 10 系统下下载并安装 Java 开发工具包(JDK 1.8),适合 Java 初学者或需要搭建开发环境的用户。 2. 安装包下载 2.1 安装包获取 由于 Oracle 官网下载需注册登录,可选择以下替代方式获取 JDK 安装…

git@github.com: Permission denied (publickey).

摘要:记录新电脑需要clone和push代码到GitHub error: Cloning into FPGA_common… gitgithub.com: Permission denied (publickey). fatal: Could not read from remote repository. 遇到的这个错误信息: gitgithub.com: Permission denied…

【Linux基础知识系列】第五十四篇 - 网络协议基础:TCP/IP

在网络通信中,TCP/IP 协议是实现设备之间数据传输的基础。TCP/IP 协议栈定义了数据在网络中传输的方式,从应用层到网络层,再到物理层,每一层都有其特定的功能和协议。理解 TCP/IP 协议的基本概念和工作原理,对于网络管…

《python语言程序设计》2018版第8章8题编写函数实现二进制转十进制(字符串变整数)!!整数没法进行下标

二进制转十进制前言第1章幻想的草稿第2章如何把这些幻想的数字带到现实的算式中第3章看来是我想多了第4章 空值不一定是最好的选择第5章 成功了前言 将字符串变成整数,但是整数没法像字符串一样做下标 反复尝试最好的手段,是多多打印 第1章幻想的草稿 …

LeetCode20

一个新手小白开始算法的学习之路,以后会不定期分享个人做完一些题目的笔记,使用语言为JavaScript//声明一个名为isValid的函数,接收一个参数s(要检查的字符串) let isValid function(s) {//初始化栈//创建一个空数组s…

Spring Boot 自动配置:从 spring.factories 到 AutoConfiguration.imports 的演变

引言 Spring Boot 的自动配置机制是其【开箱即用】特性的核心支撑,通过减少显式配置和简化开发流程,显著提升了开发效率。随着 Spring Boot 版本的迭代,自动配置的实现机制也在不断优化。本文将深入解析 spring.factories 和 AutoConfigurat…

Redis7 底层数据结构解析

Redis底层数据结构深度解析(基于Redis 7.2.5)本文深入剖析Redis核心数据类型的底层实现机制,涵盖String、Hash、List、Set、Zset的实现原理及版本演进差异。一、Redis数据存储核心机制 Redis所有数据以redisObject结构统一封装: t…

《C++初阶之STL》【auto关键字 + 范围for循环 + 迭代器】

【auto关键字 范围for循环 迭代器】目录前言:--------------- auto关键字 ---------------1. 什么是auto?2. 使用关键字auto时需要注意什么?3. 怎么使用auto关键字?--------------- 范围for循环 ---------------1. 什么是范围fo…

ionic 切换开关操作指南

ionic 切换开关操作指南 引言 在移动应用开发中,切换开关(Toggle)是一种常见的用户界面元素,它允许用户通过简单的操作来开启或关闭某个功能或设置。在Ionic框架中,切换开关提供了丰富的API和样式,使得开发…

【笔记记录-Linux文件权限与目录结构详解】

🌈个人主页: Aileen_0v0 🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​💫个人格言:“没有罗马,那就自己创造罗马~” 文章目录目录结构解析Summarypart3part4part5目录结构解析 drwxr-xr-x 2 student student 4096 10月 8 2023…

【Complete Search】-基础完全搜索-Basic Complete Search

文章目录Solution - Maximum Distance涉及遍历整个解空间的问题资料-resources 6 - Complete Search 在很多问题中(尤其是在 USACO Bronze 级别),只需检查解空间中的所有可能情况就足够了,比如所有元素、所有元素对、所有子集&…