上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 20 下一页

AI 应用思考

摘要: AI 应用思考 之前看到过一个理论,创新技术的三个阶段:新技术创造-精英服务-平民化 技术扩散的三阶段理论模型 1. 创新垄断期(精英创造阶段)技术革命初期,创新活动高度依赖知识密集型投入。AI发展呈现"分层技术"特征,核心算法突破仍由顶尖科研团队主导。 2. 价值捕获期(服务精英阶段)新技术商业化过程中,受益群体 阅读全文
posted @ 2025-03-29 21:27 见路非道 阅读(381) 评论(0) 推荐(0)

开源姿势识别 Demo

摘要: 最近项目中要用到姿势识别,调研了 BlazePose、 MoveNet 等模型,以下是一些详细的对比。 包括 mediapipe 和 tfjs 等运行环境,webgl,webgpu,wasm 都做了尝试。 具体的示例:PoseDetector开源代码:PoseDetector Source Code 阅读全文
posted @ 2025-03-15 09:00 见路非道 阅读(864) 评论(0) 推荐(0)

QwQ-32B:用强化学习打造的AI推理黑科技 🚀

摘要: 现在就体验 QwQ-32B:https://qwq32.com AI界的新星闪耀登场 ✨ 小伙伴们,AI领域又出现重大突破啦!Qwen团队最新发布的QwQ-32B模型简直太厉害了!这个只有320亿参数的模型,居然能达到参数量是它20倍的DeepSeek-R1同等表现!这不是魔法,是强化学习(RL)的 阅读全文
posted @ 2025-03-07 15:18 见路非道 阅读(224) 评论(0) 推荐(0)

计算微博垂直领域的传播力排名

摘要: 这几天,我计算了几个领域的PageRank,包括投资人,程序员这种大的垂直领域,也包括“机器学习”“数据挖掘”等这样的小的领域。在挖掘的过程中,也遇到很多有意思的事情。不过,做这个,并不是要给谁排座次,只是想尝试挖掘出来一些有意思的东西。下面是我通过“机器学习”“数据挖掘”“信息检索”等关键字找出来的一批人,然后再计算排名得到的结果。后面一列是粉丝数。不过一些新开通微博的牛人:@余凯 @老师木 尚不在其中。我的数据是之前的一个快照。这样的一个排序,和粉丝的数量关系就不太一致了。所以,垂直领域,还是能够做出很有意思的东西的。可以进一步挖掘,到底哪些因素影响了某一排名。张栋_机器学习 48966. 阅读全文
posted @ 2012-12-17 11:45 见路非道 阅读(2255) 评论(12) 推荐(1)

在微博中应用PageRank算法

摘要: 这个想法很早就有了,因为我是做搜索引擎背景的,能够深刻的理解PageRank算法在搜索引擎中的重要性,绝对的核心技术之一。不过,这篇博客,并不打算介绍PageRank算法的原理,而是,让我们来看看,这个重要的算法,在新浪微博中的应用。网页与网页之间,通过链接关系传递着重要性。在微博中呢?这个也是成立的。不过在微博中,情况要更复杂一些。所以,我在微博中指出,我并不赞同计算全量的PageRank(即所有人都参与计算)。原因有以下几点:人的主题属性和网页不同。网页往往只有一个主题,而人的主题属性比较多,我们可以将主题属性理解为人的兴趣,一般而言,人的兴趣,会不止一个。人的兴趣会随着时间不断变化,而大 阅读全文
posted @ 2012-12-13 18:44 见路非道 阅读(7690) 评论(39) 推荐(2)

large graph挖掘的技术基础

摘要: 我一直在做社交网络的挖掘工作,深感目前的一些技术并不能满足社交挖掘的需要。我并没有用过太多的工具,而且图计算的平台也没有用过,涉及到大规模数据的离线分析,主要是依赖hadoop。不过,这并不妨碍,我从挖掘需求的角度来探讨:社交挖掘到底需要哪些技术基础,需要一些什么样的工具。题目中有一个词:large graph。也有很多人认为是big graph。我之所以改变称谓,主要的原因在我前面的博客中有体现。因为big data中的个体之间,往往具有关系,这个样就组成了一个graph,并且这是个超大的graph。元数据信息要比单纯的big data要高几个量级。所以,为了进一步体现graph之大,我称之 阅读全文
posted @ 2012-11-18 18:45 见路非道 阅读(3755) 评论(27) 推荐(4)

社交圈子挖掘的问题

摘要: 这是博客搬家到博客园之后的第一篇文章,也是我最近对微博社交圈子挖掘的一些思考和总结,最近主要的思考和研究,主要针对一下几个问题:层次性重叠性ego network有向社交网络带权社交网络统一解决上面的问题(!)这几个,都是社交圈子挖掘时候我们所面临的问题,在挖掘逐渐深入的过程中,问题会一个一个显现出来。我们就要一个一个解决掉,最后要能够统一在一个方法,一个框架中。我在思考的过程中,也阅读了之前的研究,绝大部分都是针对其中的一个问题,或者两个问题。很少能够解决全部的问题。那我下面尝试分析一下这些问题的产生原因,以及一些可尝试的方法。层次性层次性是一个社会属性,在我们的社交圈子中非常的明显。比如, 阅读全文
posted @ 2012-11-15 13:26 见路非道 阅读(3530) 评论(7) 推荐(1)

大数据与复杂网络

摘要: 写这篇文章,有两个原因: 看了李院士的《大数据研究的科学价值》,有些感触。 我自己做了一段时间社交,也有一些想法。 之前也写过复杂网络的东西,但是都非常肤浅,没有真正的理解复杂网络,近期看了一些资料,有了进一步的理解。 李院士的文章,是从科学家的角度,理解大数据的价值。从文章中,我了解到以下几点: 阅读全文
posted @ 2012-11-05 17:16 见路非道 阅读(4016) 评论(8) 推荐(0)

一些不常见但是很重要的数据结构

摘要: 这篇文章是stackoverflow的一篇帖子。上面提到了很多有用的数据结构。有的听过了,经常用,有的没有听过,记录下来。Trie树。应用比较多,一个比较cool的trie的应用TRASH-A dynamic LC-trie and hash data structure。Bloom filter。wiki链接删除某一项是不允许的,不过可以实现可计数的counting bloom filter在BigTable,Cassandra中都有使用可以用来快速检查是否拼写错误Rope:rope 数据结构表示不能修改的字符序列,与 Java 的 String非常像。但是 ropes 效率奇高的字符串变换 阅读全文
posted @ 2012-10-12 11:00 见路非道 阅读(2455) 评论(0) 推荐(1)

Cassandra——一些比较和回想

摘要: 这篇文章,包含了一些技术,包含了一些回忆。今天看了360的有关Cassandra实践的ppt,有一些感想。让我想起了两年前的一些事情,不过那时,我做的不是存储,而主攻的分布式检索。后来一系列变化,我也经历了很多,后来安下心来,做存储优化,优化的对象就是Cassandra,这也有一年多的时间。理论深厚,心得颇丰,可是仍然缺乏一线经验积累。看到360这么大规模的应用Cassandra,我很高兴。尽管,没有一同战斗,但是我很欣慰,很开心。Cassandra终于摆脱阴影,站起来了。Cassandra在360部署有1500台服务器。国内首屈一指了,还有一家部署规模在这一半左右。不过,单个Cassandr 阅读全文
posted @ 2012-09-18 16:03 见路非道 阅读(1030) 评论(1) 推荐(0)
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 20 下一页