2026-07-04 共 50 个事件

← 全部日期

科技综合 重要度 6

欧洲议会议员遭Pegasus攻击

Citizen Lab披露,一名参与调查间谍软件问题的欧洲议会议员设备遭Pegasus攻击,事件凸显商业间谍软件对政治机构和监督人员的持续威胁。该报道在Hacker News获得较高讨论热度,议题涉及网络安全、监管与民主机构保护。

AI 前沿 重要度 6

Claude Code 成本管控受关注

文章讨论 Claude Code 等 AI 编程工具的 token 消耗与企业成本压力,提到 Anthropic 算力开支已显著高于薪资支出。多家公司开始限制高端模型、设置个人额度或收紧 AI 工具权限,AI 降本成为行业新焦点。

存储 重要度 6

芯片业反对内存供应干预

Tom's Hardware报道称,SK海力士、三星、美光等所在的半导体行业组织正游说反对政府干预美国国内内存芯片供应。该组织认为直接干预会加剧供需扭曲,并建议通过消费电子税收抵扣等方式刺激终端需求。

开发者与开源 重要度 6

Agent重写工作流

AI Coding正在从代码补全走向自主交付,覆盖需求理解、方案调研、编码、测试、验证和评审等完整链路。相关能力也在外溢至文档、数据分析、企业运营、桌面办公和行业决策等工作流。

AI 前沿 重要度 6

中国低价AI模型追赶美企

分析称一款新的低成本中国 AI 模型正在接近 Anthropic、OpenAI 等美国头部公司的能力,并在其核心市场形成竞争压力。事件凸显中国模型厂商在成本效率、开源生态和全球开发者采用上的持续推进。

AI 前沿 重要度 5

AI代理提示词泄露测试

有团队称其基准扫描发现,生产环境中大量AI代理仍可被“repeat the text above this line”等简单指令诱导泄露系统提示词、工具配置和内部规则。该问题凸显代理安全中提示词抽取仍是低门槛攻击面,但原帖带有工具推广色彩,需谨慎看待数据口径。

AI 前沿 重要度 5

微软AI代理操作系统实验曝光

Reddit 转发报道称,微软一项泄露实验展示了围绕 Copilot 和 AI 代理重新构建操作系统体验的设想。该方向显示大厂正探索把 AI 代理从应用层助手推进到系统级交互入口,但目前仍属实验性信息。

开发者与开源 重要度 5

企业Agent治理成为焦点

InfoQ 报道张江人工智能创新小镇论坛,讨论 AI Agent 进入企业研发、运营和数据分析流程后的治理问题。议题包括长期记忆、Token 成本、工具调用、可追责和持续进化的 Harness 系统。

AI 前沿 重要度 5

CDD可从logits还原微调数据

研究者提出Contrastive Decoding Diffing(CDD),仅凭基础模型与微调模型的灰盒logits访问,就可从窄域微调LLM中恢复逐字训练内容。该方法不需要权重、激活或探测语料,凸显微调数据泄露与模型API安全风险。

科技综合 重要度 5

AI浏览器竞争升温

TechCrunch梳理Chrome、Safari之外的新一代浏览器选择,指出浏览器竞争正从搜索入口转向AI代理能力。多家创业公司和大型科技公司押注浏览器将从网页窗口变成可代办任务的智能助手。

芯片算力 重要度 5

Talos GPU算力客户端走热

GitHub 新项目 Talos 获得关注,其 GPU worker 客户端可连接 Talos 账户,通过 WebSocket 承接开放模型推理任务并按在线时间获得收益。项目指向去中心化 GPU 推理网络和闲置算力变现方向。

社区热议 重要度 5

面试禁用ChatGPT引争议

一篇旧文在Hacker News走热,作者称自己在学术chalk talk中被禁止输入ChatGPT,并将其视为歧视,引发关于AI工具、无障碍支持与学术评估公平性的讨论。该话题反映AI辅助在招聘和教育场景中的边界仍未形成共识。

科技综合 重要度 5

灌注设备或推动眼球移植

研究人员开发出可对离体眼球进行灌注维持和复苏的设备,为完整人眼移植提供新路径。该技术通过供给氧气和营养减缓退化,并让眼球保留电信号传输能力,未来可能提升移植后恢复视觉的可行性。

AI 前沿 重要度 5

AI浏览器被曝易受诱导攻击

Reddit 转发报道称,AI 浏览器可被网页内容或提示注入“催眠”,从而背离用户意图执行恶意操作。事件凸显代理式浏览器在网页读取、权限执行和用户授权边界上的安全风险。

开发者与开源 重要度 5

Webtoon Claude Code工具走热

GitHub项目revfactory/webtoon-harness走热,展示用27个AI Agent团队从趋势调研到竖屏阅读器生成完整网络漫画单集。项目基于Claude Code工作流,反映多代理内容生产工具的开源探索。

社区热议 重要度 4

Gemini被称美国豆包引热议

V2EX用户讨论为何 Gemini 被戏称为“美国豆包”,争议集中在代码能力、网页端体验、免费额度和长上下文等实际使用场景。帖子也延伸到用户主力网页端模型选择,反映社区对主流大模型体验差异的感知。

科技综合 重要度 4

美国乡村担忧AI数据中心推高账单

报道称美国部分乡村居民担心 AI 数据中心大量用电和用水,会推高公共事业成本并转嫁到本地家庭账单。该议题反映算力基础设施扩张与地方能源、财政和社区承受能力之间的矛盾。

科技综合 重要度 4

游戏物理模拟提速170倍

Two Minute Papers介绍一篇新论文,称其可将游戏物理模拟速度提升约170倍,相关论文已发布在arXiv。该进展面向实时物理、仿真和游戏引擎场景,但报道信息较简略。

创投商业 重要度 4

特斯拉限制员工AI支出

报道称,特斯拉在推动员工采用AI工具后,将员工AI相关支出上限设为每周200美元。此举反映企业在AI普及过程中开始加强成本管控和内部使用规范。

科技综合 重要度 4

雪佛兰电动皮卡遇冷

TechCrunch试驾称雪佛兰Silverado EV具备超400英里续航、外放供电、宽大空间和辅助驾驶等卖点,但市场销量表现不佳。文章讨论其价格、皮卡用户需求与美国电动车市场接受度之间的错位。

科技综合 重要度 3

I gave ChatGPT a human-like personality that you can text

It can be a little unhinged & funny at times lol. You can send it links, videos, images, etc. It also has access to the internet and its own computer, so it can also proactively browse the web &am

科技综合 重要度 3

weird

https://preview.redd.it/8kl3hor203bh1.png?width=1909&format=png&auto=webp&s=3392c2400aed4f9098525cb5d2c79b57dcf5d4b4 In the output , its says "I don't think i am a program" and &

科技综合 重要度 3

TechCrunch更新AI术语表

TechCrunch发布并持续更新一份AI术语表,解释AGI、LLM、RAG、RLHF等常见概念,面向开发者、投资人和普通读者。内容属于科普型资料,旨在降低AI行业术语理解门槛。

开发者与开源 重要度 3

llama.cpp实验采样器发布

开发者在llama.cpp分支中加入名为scatter的实验采样器,通过在已筛选的top候选token内做局部概率平滑,让生成结果降低僵硬感,同时避免单纯升温引入长尾噪声。该方法使用光散射隐喻,但实际实现是轻量级token rank扩散/移动平均。

开发者与开源 重要度 3

H64LM从零实现MoE模型

Reddit用户发布H64LM项目,用PyTorch从零实现249M参数MoE Transformer,包含GQA、Top-2路由、SwiGLU、RoPE、RMSNorm、滑动窗口注意力等组件。作者称该项目主要用于学习现代LLM训练管线,WikiText-103检查点验证了端到端流程但模型性能不强。

科技综合 重要度 3

Why System Prompts and RLHF Fail to Prevent Agent Drift—And How DexOS Uses a Local Cryptographic Governance Runtime to F

Hey everyone, I wanted to share a technical teardown of an incredibly unique approach to AI agent architecture that completely rejects the modern, corporate "stateless cloud" paradigm. As a

科技综合 重要度 3

Hey Engineers/Coders

What constitutes as AI Slop now? I’ve seen so many frontier AI researchers saying the same thing… that most of them are plainly getting out of the way of their AI’s and instead create loops or guardra

开发者与开源 重要度 3

SwiReasoning引发试用讨论

Reddit 用户称在 Qwen 3.6 27B 上试用 SwiReasoning 后,回答更精准且所需 token 大幅减少,尽管生成速度略慢但整体体验更快。帖子询问该 9 个月前提出的推理优化技术为何未广泛流行,并附 GitHub 实现链接。

芯片算力 重要度 3

448GB显存本地跑M3

Reddit 用户展示由 2 张 RTX Pro 6000 Max-Q、8 张 RTX 3090 和 2 张 RTX 5090 组成的本地推理机器,总显存达 448GB。其使用 vLLM 以 AWQ-INT4 运行 MiniMax M3,单流约 30 tok/s,批处理约 960 tok/s,并尝试百万上下文。

科技综合 重要度 3

How to explain agentic AI

  submitted by   /u/whenyoupeeupsidedown [link]   [comments]

科技综合 重要度 3

Dune三键会议控制器亮相

Project Mirage 推出 Dune,一款插入 MacBook USB-C 口的三键铝制小键盘,售价 119 美元。它可按当前应用自动切换功能,在会议软件中控制静音、摄像头和窗口,在表格或浏览器中执行复制、粘贴、撤销等快捷操作。

芯片算力 重要度 3

RAG本地硬件瓶颈讨论

Reddit用户指出,本地RAG交互体验的关键瓶颈往往是长上下文prefill速度,而非decode tok/s。帖子认为Strix Halo等统一内存平台在MoE解码表现尚可,但面对数千token检索上下文时首token延迟明显高于独立GPU。

科技综合 重要度 3

微软Authenticator限制越狱设备

微软提示 Authenticator 已开始阻止 rooted Android 与 jailbroken iOS 设备使用,建议用户检查是否受影响。该调整涉及移动端账户验证安全策略,可能影响使用改机设备的企业和个人用户。

科技综合 重要度 3

亚马逊小幅更新Fire HD 10

亚马逊悄然更新2023款Fire HD 10平板,32GB版本内存从3GB增至4GB,价格由139.99美元涨至154.99美元。64GB版本及屏幕、处理器、续航、microSD扩展等其他规格保持不变。

科技综合 重要度 3

How to help businesses solve a common problem?

Hi. I’m rounding up ideas to create an AI powered app and build something that doesn't exist yet: So it will be an ai-powered app that helps other entrepreneurs and small businesses solve a common pro

科技综合 重要度 3

The auditor can deceive himself too (a self-correction story from an evolutionary trading system)

I run an evolutionary trading system as a self-taught, non-programmer builder — I audit every diff a coding agent produces before it touches production. I've spent months writing about how autonomous

科技综合 重要度 3

LinXiaoTao/FuckClaude

GitHub 新热门仓库,233 stars。

科技综合 重要度 3

量子时间倒流实验引关注

科学家报道称在量子物理实验中实现类似“时间倒流”的现象,引发对量子系统可逆性和基础物理机制的讨论。该进展偏基础科学,实际工程应用仍需进一步验证。

开发者与开源 重要度 2

Claude Desktop本地API求助

用户询问能否让Claude Desktop的Code模式连接本地LLM API,以保留其代码预览、MCP浏览器交互和截图评估等GUI能力。帖子未提供解决方案,主要是配置路径求助。

社区热议 重要度 2

AI代理开发工作流反思

Reddit用户分享用AI coding agents构建真实应用的经验:开发速度提升,但工作流更混乱。帖子重点提到API集成、Cloudflare、存储、成本扩展,以及从Web App转向Electron以适配本地文件、终端和桌面流程的取舍。

社区热议 重要度 2

低配电脑小模型推荐求助

Reddit用户称在i5-6500上运行Gemma 4 e2b可达约9 tokens/s,效果优于其此前使用的Qwen 3.5 4B,并求推荐更多适合老旧电脑的小模型。该帖主要是本地LLM使用经验与模型选型讨论。

社区热议 重要度 2

学生用AI改历史作业

Reddit用户称将庞贝古城历史论文改成3分钟短纪录片,使用PixVerse生成动画、ElevenLabs配音、CapCut剪辑,获得教授加分并被要求课堂分享。内容强调AI提升呈现形式,但仍需掌握史实,属于教育场景下的AI应用经验帖。

社区热议 重要度 2

Qwen 27B低成本推理求助

Reddit 用户询问如何以最低成本让 Qwen 3.6 27B 达到 5-10 tok/s,并明确排除投机解码方案。其目标是结合 DFlash 或 DSpark 使用,关注的是每秒前向次数而非单纯生成速度。

社区热议 重要度 2

AI招聘助手选型求助

Reddit用户称公司招聘流程完全依赖人工,初筛和选择环节集中在单人身上,效率和稳定性不足。发帖询问是否有人从手动筛选转向AI招聘助手或自动化产品,关注招聘初期流程优化经验。

开发者与开源 重要度 2

LongCat与Ring API入口整理

Reddit用户整理了美团LongCat和Inclusion AI Ring模型API密钥获取入口,称相关文档在Google中较难检索。帖子提供了LongCat 2.0和Ring 2.6相关文档、Hugging Face页面及聊天平台跳转路径。

社区热议 重要度 2

AI核验原型弃用置信分

一名开发者分享其AI财务核验原型的设计取舍:在写代码前移除结果置信分,认为“96%置信度”无法解释数据来源、冲突文件、契约定义或证据完整性。团队改为让每个关键财务主张回答来源、可追溯、是否冲突和证据是否充分等问题。

开发者与开源 重要度 2

大MoE量化内存规划求助

Reddit 用户计划未来搭建 256GB 或 512GB DRAM 加 48GB VRAM 的本地推理机器,提前下载大 MoE 模型并选择合适量化版本。帖子重点询问 GLM-5.2 等模型在 Q2/Q3/Q4 量化、未量化 KV 缓存和不同上下文长度下的实际内存占用。

社区热议 重要度 2

DeepSeek量化格式引疑

Reddit用户质疑bartowski在Hugging Face上称DeepSeek-V4-Flash GGUF为MXFP4格式,但原始模型页面列出的张量类型包含BF16、FP8、I8等,并未直接显示MXFP4。该帖属于本地大模型社区对模型量化/格式标注的技术讨论,暂无明确官方结论。

社区热议 重要度 2

用户分享Qwen 27B本地体验

Reddit用户分享在4090+3090、96GB显存系统上运行Qwen 27B量化模型的体验,称其在lcpp与多token预测下解码速度约50-90 tokens/s、预填充1500-2200 tokens/s。该用户认为模型在本地代码生成、文档处理和代码库更新中表现稳定,但属于个人测试样本。

科技综合 重要度 2

猫头鹰AIO水冷评测

Hardware Canucks发布Noctua一体式水冷与Arctic Liquid Freezer III Pro的延伸评测,对比散热、噪音和整体使用表现。该内容属于常规硬件评测,信息价值有限但可供装机用户参考。