V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ipwx  ›  全部回复第 40 页 / 共 195 页
回复总数  3898
1 ... 36  37  38  39  40  41  42  43  44  45 ... 195  
2021-11-10 16:48:51 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 嗯,再引入一个新的记号,l(x)

在回归任务中,l(x) = f(x) - t[x]

其中 f(x) 是神经网络输出,t[x] 是 x 对应的标注( label )。

那么 L = E_x[l(x)]

就算是普普通通的回归任务还是有这个 E_x 。只是现在的人上手都是 pytorch 框架,直接写 loss='mse',没看见它源代码里面的求平均而已。。。而这个求平均的数学意义是蒙特卡洛采样

E_x[f(x)] 约等于 1/N f(x[i]), x[i] 是 第 i 个从 p(x) 上采到的样本。

如果 x 是训练集数据,那么采样只需要取一个 mini-batch 就行了。
2021-11-10 16:39:06 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
顺便 L = E_x[f(x)] 是神经网络很普适的写法,表示的是 x 从全部训练集上采样(也就是 mini-batch ),E_x 就是 mini-batch 上所有 f(x) 的平均,这个在代码里面也很常见才对。
2021-11-10 16:37:35 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
你这形式化还是不太对劲。你能不能作业拍个照截个图。

f(x) = g(a) 这个肯定有问题。

f(x) = E_a[g(x,a)], a ~ q(a) 或者 a~q(a|x) 那我还能理解。

----

另外用 a 来表示分布变量,你这是在做 Reinforcement learning 的 action network 吗?

这样的话你需要用 REINFORCE 算法去蒙特卡洛采样 a 。当然具体请参照 RL 的最新文章,我不是专门做 RL 的。

不管怎么样如果你的目的是优化 f(x),那么你的 loss 应该是


L = E_x[E_a[g(x,a)]]

其中 x ~ p(x) 是数据分布,a ~ q(a) 或者 q(a|x) 是 action network 导出的分布。当然一般而言我觉得 q(a) 应该是有条件概率 q(a|x) 的。

max L 就梯度下降 min -L
2021-11-10 15:26:01 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 每个 mini-batch

随机采样,计算 f(x[i]) 然后求平均。接着梯度下降 -(sum f(x[i]))/N
2021-11-10 11:18:07 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
除非你的 f(x) 有值域,那么这个函数会被推向下界(或者上界)。

为了避免 f(x) 退化成常值函数,你的训练目标或者网络结构必须把数据之间的关联性发掘出来。。。所以你这个问题是不是真的不对头,不好说,得看你的问题数据本身是什么样子,以及神经网络是什么样子。

但是在我的经验中,for any x, max f(x) 很少见。至少也是 max E[f(x)]
2021-11-10 11:15:53 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 那这个问题的定义很奇怪,因为对于一个足够宽的、一个非线性层的神经网络,可以拟合任何实数域上的可测函数。也就是说,

对于任何 C ,f(x) 恒等于 C

是你这个神经网络可以拟合的函数。

最终你会得到一个 meaningless 的函数,C 在训练过程中不断被推向负无穷(或者正无穷)
2021-11-10 10:25:56 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 那行,所以你的问题是哪个

max sum_x f(x)
for any x, max f(x)
2021-11-10 10:24:03 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 你看,这不是 y=xxxxxx 我需要看你数学公式的形式化,而是问你,你的“最大化一个函数”到底形式化是什么意思。我给了两个形式:

max sum_x f(x)
for any x, max f(x)

所以你是哪个?
2021-11-10 10:23:09 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
对于单独的 for any x, max f(x) 这个问题似乎就没有意义了
2021-11-10 10:22:47 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
so 你是不是想要 max L=sum_x f(x)
2021-11-10 10:22:09 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
@zxCoder 不是,那你的目标到底是什么。。。

你一直在说值最大,但是不可能没有目标啊?没目标你根本不是有监督(你说的有标签)学习。
2021-11-10 10:08:59 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
这种东西不能靠叙述,它根本不精确。上公式啊喂
2021-11-10 10:08:36 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
还有,两个线性层和一个激活层它顺序到底是啥?

y = A2*(u(A1*x+b1)) + b2 ?

如果是 y = u(A2*(A1*x+b1)+b2) 那是没有用的。两个线性层和一个线性层没有区别(参数可以训练的情况下)
2021-11-10 10:06:58 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
1 、你要训练的是 f(x) 本身? f(x) 可变?
2 、那训练了之后 y=f(x) 就变了啊。。。它可以变成任何东西。你有训练目标吗?就是 t[x] = f(x) 的正确答案 t[x]。
3 、没有目标去训练,它可以变成任何值啊。


楼主能不能用数学语言形式化一下你的问题,我无法理解。
2021-11-09 23:36:14 +08:00
回复了 zxCoder 创建的主题 问与答 请教一个神经网络求函数最大值的问题
你能不能把你的原始问题说一说。

这估计也是个 XY problem
2021-11-09 17:34:13 +08:00
回复了 LeeReamond 创建的主题 问与答 有没有将近似的 hash 认为是相同 hash 的 hashset?
2021-11-09 17:34:04 +08:00
回复了 LeeReamond 创建的主题 问与答 有没有将近似的 hash 认为是相同 hash 的 hashset?
@3dwelcome 那就 kd-tree
2021-11-09 17:14:34 +08:00
回复了 LeeReamond 创建的主题 问与答 有没有将近似的 hash 认为是相同 hash 的 hashset?
2021-11-05 13:44:25 +08:00
回复了 oncetalk 创建的主题 奇思妙想 是不是应该把浏览器也看做操作系统?
这种打比方很蠢的。对高级一点的计算机 /人工智能 /数学概念都是毁灭性打击。

不能仔细理解概念的细节,就不懂原来的技术有什么优缺点、它适用边界在哪里;(或者数学定理是不是能用)

回想一下学高数微积分是不是总有一些题目做错?没错,就是概念没理清。
1 ... 36  37  38  39  40  41  42  43  44  45 ... 195  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2430 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 04:09 · PVG 12:09 · LAX 21:09 · JFK 00:09
Developed with CodeLauncher
♥ Do have faith in what you're doing.