会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
芋圆院长
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
10
···
17
下一页
2023年4月18日
强化学习奖励函数的设置
摘要: 奖励奖励 强化学习中奖励函数设置不好,agent也得不到好的解。 ##确定奖励函数的注意事项 明确任务目标:一定要确保奖励函数和任务目标是一致的,否则可能会出现奖励函数引导 agent 在任务上取得不良的表现。 注意:因为算法目标是最大化奖励,所以需要看奖励和目标之间的关系。当我的奖励最大的时候,是
阅读全文
posted @ 2023-04-18 11:23 芋圆院长
阅读(924)
评论(0)
推荐(0)
2023年4月15日
坡度比
摘要: 坡度 参考链接:什么是坡比?什么是坡度?计算公式各有什么不同? - 工程造价君的文章 - 知乎 https://zhuanlan.zhihu.com/p/338311558
阅读全文
posted @ 2023-04-15 21:28 芋圆院长
阅读(343)
评论(0)
推荐(0)
Python 中的嵌套字典
摘要: chatGPT YYDS 我自己查了乱七八糟的链接好多,也没有搞清楚(当然,看了正确的代码只觉得自己傻乎乎)最终答案是: You: 我想创建一个字典嵌套字典 ChatGPT: 好的,你可以使用以下代码创建一个字典嵌套字典: my_dict = { "outer_key1": { "inner_key
阅读全文
posted @ 2023-04-15 10:58 芋圆院长
阅读(216)
评论(0)
推荐(0)
Python运行过程中想要保存数据
摘要: 前言 自己写的Python代码循环太多了,想缩减一下迭代步数,但又舍不得之前已经产生的数据。 就想去看看这个问题有无解决方案。 理论上来说,中途中止看到现在程序运行的情况应该是合理的。 所以,就找到了这个知乎问题: 参考链接:能不能在手动停止python程序的时候将处理到一半的数据保存出来? - 知
阅读全文
posted @ 2023-04-15 09:49 芋圆院长
阅读(545)
评论(0)
推荐(0)
2023年4月11日
Latex使用注意事项
摘要: 浅记一下笔记,虽然这一次用完之后估计很少用了。 准备工作 之前看过一些准备工作,要安装这个软件,那个软件巴拉巴拉。自己也试了几遍(还是没成功),然后就直接转战 overleaf了。直接上传到网页上,也不用自己安装,还方便分享给别人修改。 模板:写论文一定要有模板,latex也不例外。有了模板基本上很
阅读全文
posted @ 2023-04-11 15:57 芋圆院长
阅读(110)
评论(0)
推荐(0)
2023年4月7日
JAVA - 面向对象编程
摘要: > 面向对象是在之前基本实现的基础上的又一抽象,这里的 “高内聚,低耦合” 体现的更加明显,有抽丝剥茧、不断总结的感觉了。 > 学习的时候真的会有拨开云雾见月明的感觉,这种感觉真的会上瘾。你慢慢发现所有的东西都在以自己的规律运转,发现 验证 使用,真的很有《实践论》的味道。 > 我能做些什么?知道这
阅读全文
posted @ 2023-04-07 19:30 芋圆院长
阅读(38)
评论(0)
推荐(0)
2023年4月6日
JAVA - 基础篇
摘要: > 时隔这么久,之前学习JAVA一直没有坚持下来,这次一定要坚持啊。 > 是跟着 B站 尚硅谷的老师学习的!资料非常齐全,讲得也很认真仔细。 > 这里会记录一些简单的归纳,很全很全的在老师的资料里就有!关注公众号就能领取,尚硅谷教育。 ## 前言 学习一门计算机语言真的是一件很奇妙的事情,单靠简单的
阅读全文
posted @ 2023-04-06 14:40 芋圆院长
阅读(42)
评论(0)
推荐(0)
2023年3月16日
能量单位(焦耳、瓦和千瓦时)
摘要: 前言 总是会有一些领域里的常识,以这个标签来记录我学到的“常识”。 能量单位:焦耳 一焦耳等于 1N 的力在对应力的方向上移动1米所做的功,也等于 1W 的功率在1秒内所做的功。 1千瓦时就是1度。 参考链接:https://baijiahao.baidu.com/s?id=173885587665
阅读全文
posted @ 2023-03-16 21:49 芋圆院长
阅读(1394)
评论(0)
推荐(0)
强化学习如何判断值函数收敛?
摘要: 常用方法包括: 观察值函数的变化:在训练过程中,可以观察值函数的变化情况,如果值函数的变化趋势逐渐变缓,最终基本不再变化,可以认为值函数已经收敛。 判断动作状态值函数的变化:在 Q-learning 等算法中,动作价值函数可以表示为每个状态下每个动作的价值。可以通过计算每个状态下所有动作价值函数的差
阅读全文
posted @ 2023-03-16 15:13 芋圆院长
阅读(889)
评论(0)
推荐(0)
2023年3月13日
Python 可变对象与不可变对象
摘要: 一直对这个问题很好奇,感觉这个涉及数据存储的方式和规划,听起来就很有意思。所有面向对象的语言应当都有可变对象和不可变对象。 概念 Python中一切皆对象,每个对象都有自己的id,type和value。 id:一个对象被创建后,需要在内存中存储,这个地址就是 id 值。 type:和 id 一样,当
阅读全文
posted @ 2023-03-13 10:33 芋圆院长
阅读(74)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
10
···
17
下一页
公告