2026年4月7日

万字详解 RAG 基础概念:什么是 RAG? 为什么需要?工作原理是?

摘要: 去年面字节的时候,面试官问我:“你们项目里的知识库问答是怎么做的?” 我说:“直接调 OpenAI 的 API,把文档塞进去让模型自己读。” 空气突然安静了三秒。我看到面试官的眉头皱了一下,才意识到事情不对——当时我们项目的文档有 20 多万字,每次请求都超 Token 上限,而且模型根本记不住上周 阅读全文

posted @ 2026-04-07 13:13 JavaGuide 阅读(484) 评论(0) 推荐(0)

2026年3月30日

万字拆解 LLM 运行机制:Token、上下文与采样参数

摘要: 在探讨 RAG、Agent 工作流、MCP 协议等复杂架构的过程中,我发现一个非常普遍的现象:很多开发者在构建 Agent 工作流或调优 RAG 检索时,往往会在最底层的 LLM 参数上踩坑。比如,为什么明明设置了温度为 0,结构化输出还是偶尔崩溃?为什么往模型里塞了长文档后,它好像失忆了,忽略了 阅读全文

posted @ 2026-03-30 10:34 JavaGuide 阅读(511) 评论(0) 推荐(0)

2026年3月20日

MiniMax M2.7 发布!Redis 故障排查 + 跨语言重构场景实测,表现如何?

摘要: 前两天刷到 MiniMax 正式发布了 M2.7 版本。 官方在 SWE-Pro 软件工程基准测试中拿到了 56.22% 的成绩,第三方评测机构 PinchBench 也显示它已经升到排行榜第四,超过了 Nemotron 3。 我日常开发中也会搭配 MiniMax 辅助写代码,毕竟量大管饱,从 M2 阅读全文

posted @ 2026-03-20 17:47 JavaGuide 阅读(933) 评论(0) 推荐(0)

2026年3月19日

美团面试:为什么要用分布式缓存?本地缓存呢?多级缓存一致性如何保证?

摘要: 去年面美团的时候,面试官看着我的简历问:“我看你们项目里有个全局字典模块,里面那些省市代码、订单状态配置,是怎么做缓存的?” 我为了展现系统的高并发架构,立马拔高音量说:“为了保证系统的高可用和拓展性,我们专门用了一套 Redis 集群,每次业务流转都去 Redis 里查字典,绝对扛得住大流量。” 阅读全文

posted @ 2026-03-19 14:12 JavaGuide 阅读(673) 评论(0) 推荐(0)

2026年3月16日

鹅厂面试:SELECT * 一定导致索引失效?常见索引失效场景有哪些?

摘要: 在数据库性能优化中,索引是最直接有效的优化手段之一。然而,建了索引并不等于一定能用上索引。实际开发中,我们经常遇到这样的困惑:明明在字段上建立了索引,查询却依然慢如蜗牛,通过 EXPLAIN 分析发现居然是全表扫描。 导致索引失效的原因多种多样,既有 SQL 语句写法问题,也有索引设计不当的因素。有 阅读全文

posted @ 2026-03-16 17:05 JavaGuide 阅读(307) 评论(0) 推荐(0)

2026年3月12日

再见 OpenClaw,MaxClaw 一键平替,企业微信/微博/飞书/钉钉接入

摘要: 如果你最近关注 AI Agent 领域,大概率在各大开发者社区和社交平台被一只红色的 🦞 刷屏过。 它不是海鲜,而是当下 AI 圈真正的超级顶流——OpenClaw。 什么是 OpenClaw? OpenClaw(中文圈戏称”小龙虾”),是当下 AI 圈顶流的超级助理。它不仅是大语言模型,更是 A 阅读全文

posted @ 2026-03-12 12:24 JavaGuide 阅读(667) 评论(1) 推荐(1)

2026年3月6日

字节二面:Redis 能做消息队列吗?怎么实现?

摘要: Java 面试 & 后端通用面试指南(Github 收获155+k Star,共有 600+ 位贡献者共同参与维护和完善):javaguide.cn。 先说结论:可以是可以,但要看具体场景。和专业的消息队列(如 Kafka、RabbitMQ)相比,还是有一些欠缺的地方。 正式开始介绍之前,我们先来看 阅读全文

posted @ 2026-03-06 13:28 JavaGuide 阅读(491) 评论(0) 推荐(1)

2026年3月2日

7 道 RAG 基础概念知识点/面试题总结

摘要: Java 面试 & 后端通用面试指南(Github 收获155+k Star,共有 600+ 位贡献者共同参与维护和完善):javaguide.cn。 去年面字节的时候,面试官问我:"你们项目里的知识库问答是怎么做的?" 我说:"直接调 OpenAI 的 API,把文档塞进去让模型自己读。" 空气突 阅读全文

posted @ 2026-03-02 20:07 JavaGuide 阅读(286) 评论(0) 推荐(0)

2026年2月27日

Claude Opus 4.6 真的用不起了!我换成了国产 M2.5,实测真香!!

摘要: 春节前后,大模型市场神仙打架:MiniMax M2.5、GPT-5.3-Codex、GLM-5、Opus 4.6、Qwen3.5-Plus 轮番登场。但作为每天跑 Agent 的重度用户,我的体感却很复杂——尤其是面对 Opus 4.6 的账单时。" 说实话,Opus 4.6 的能力确实强,但那个价 阅读全文

posted @ 2026-02-27 16:11 JavaGuide 阅读(2634) 评论(3) 推荐(3)

2026年2月26日

微信面试:什么是一致性哈希算法?适用什么场景?

摘要: Java 面试 & 后端通用面试指南(Github 收获155+k Star,共有 600+ 位贡献者共同参与维护和完善):javaguide.cn。 开始之前,先说两个常见的场景: 负载均衡:由于访问人数太多,我们的网站部署了多台服务器个共同提供相同的服务,但每台服务器上存储的数据不同。为了保证请 阅读全文

posted @ 2026-02-26 16:44 JavaGuide 阅读(63) 评论(0) 推荐(0)

导航