推出 GeneBench-Pro
GeneBench-Pro 是一项面向研究级别的基准测试,旨在衡量 AI 智能体在计算生物学中如何处理不确定性并做出关键性判断,这是对原始 GeneBench 的扩展。它通过测试更高级别的能力(如处理数据噪声、修正假设以及判断结果是否达到决策就绪状态)来克服当前评估方法的局限性。
GeneBench-Pro 是一项面向研究级别的基准测试,旨在衡量 AI 智能体在计算生物学中如何处理不确定性并做出关键性判断,这是对原始 GeneBench 的扩展。它通过测试更高级别的能力(如处理数据噪声、修正假设以及判断结果是否达到决策就绪状态)来克服当前评估方法的局限性。
OpenAI工程师通过识别两个不同的原因,解决了其Rockset数据基础设施中无法解释的C++崩溃问题:Azure主机上的静默硬件损坏以及GNU libunwind中存在的一个18年历史的竞态条件。
OpenAI Signals数据显示,ChatGPT的全球采用正在广泛且深入地扩展,用户每日发送的消息量增加了50%,且在注册六个月后尝试的不同任务数量翻倍。
llama.cpp b9849 版本引入了对 URL 授权部分中括号括起的 IPv6 字面量的支持,允许服务器按照 RFC 3986 解析 [host]:port 格式。此更新确保了监听日志、代理标头和客户端重建的正确格式化,同时保持 bare remote_addr 以用于每个请求的跟踪。
Google 发布了两个新的 AI 模型,Nano Banana 2 Lite 和 Gemini Omni Flash,旨在增强开发人员构建智能应用的能力。
llama.cpp 项目发布了 b9848 版本,其中包含对 CUDA 后端的紧急修复,以解决行数超过 65535 的表上 `get_rows_back` 函数的问题。此更新解决了之前影响大型表操作的 grid-y 钳位和步长错误。
llama.cpp 项目已发布 b9847 版本,其中包含对 CUDA 上 Gemma E4B MTP FlashAttention 的修复以及移除未使用的模板声明。
llama.cpp 项目已发布 b9846 版本,其中包含针对 Asahi Linux 的 Vulkan 后端优化。此更新将矩阵乘法中的块大小循环回滚,以改善在运行 Linux 的 Apple Silicon 硬件上的兼容性和性能。
llama.cpp 项目发布了 b9844 版本,该版本为 NVFP4 量化格式引入了 ggml-webgpu 支持。此次更新还提供了适用于 macOS、iOS、Linux、Android、Windows 和 openEuler 的预构建二进制文件,覆盖多种硬件后端。
Google UK发布了最新的经济影响报告,详细阐述了帮助更多人解锁该国AI驱动技术红利的策略。
llama.cpp 项目已发布 b9843 版本,为 macOS、Linux、Android、Windows 和 openEuler 在各种硬件架构上提供预构建的二进制文件。
LangGraph 版本 1.2.7 已发布,为 LangChain 生态系统引入了错误修复和依赖更新。
微软研究院推出 Memora,这是一个可扩展的智能体记忆框架,旨在为长周期 AI 任务平衡抽象与具体性。该系统将丰富的记忆内容与轻量级的检索结构解耦,在基准测试中创下新的最先进成果,同时最多减少 98% 的上下文 token。
Claude Code 版本 2.1.196 引入了组织默认模型、可点击的文件附件以及针对 MCP 服务器审批的改进安全性。此次更新还增强了后台会话的可靠性,修复了各种智能体状态报告问题,并优化了代码审查工作流中的令牌使用。
一位Google专家解释了采用全栈方法处理人工智能的概念。 文章强调,这种综合方法论长期以来一直是Google AI工作的基础。
llama.cpp b9842 版本引入了对 /v1/models 端点中预设和缓存模型条目的去重更改。此更新由来自 Hugging Face 的 Adrien Gallouët 审核通过。
研究人员发布了 Brain2Qwerty v2,这是一种非侵入式 AI 管道,可从脑磁图(MEG)记录中实时解码句子,无需手术植入。该系统整体词准确率达到 61%,顶级表现者高达 78%,显著优于先前的非侵入式方法。
llama.cpp b9840 版本引入了对 DeepSeek V4 模型的转换支持,包括对 Pro 变体的特定处理。此次更新将新架构集成到库中,并伴随各种内部优化和错误修复。
OpenAI经济研究已将AI就业转型框架扩展至欧盟,利用ESCO分类法和Eurostat数据来分析AI能力如何重塑各成员国的劳动力市场。
llama.cpp 项目已发布 b9839 版本,其中包含修复被忽略工作树中 Tailwind 扫描的更新。此更新为 macOS、Linux、Android、Windows 和 openEuler 提供了预构建的二进制文件,支持多种架构和硬件加速后端。