全部文章 — korshunov.ai

全部文章页 1 / 21

blog Simon Willison · 3 小时前

理解才能参与

Geoffrey Litt 认为，开发人员必须深入理解由编码代理生成的代码，以避免认知债务并保持作为创造性过程中的积极参与者。

media r/LocalLLaMA · 3 小时前

OpenLumara 现在通过 OpenAI 端点桥接任何 UI 到本地模型

开源框架 OpenLumara 现在支持与任何能够与 OpenAI 端点通信的用户界面连接，例如 KoboldLite 和 OpenWebUI。此更新允许用户将节省 token 的框架集成到现有工作流程中，而无需更改首选的前端。

media r/LocalLLaMA · 3 小时前

有人在使用像QGIS这样的软件进行大规模空间或城市布局生成时，使用本地LLM吗？

一位用户正在寻求关于能够生成大规模结构数据（例如整个城市布局、道路网络和复杂网格系统）的本地语言模型的推荐。

media r/LocalLLaMA · 5 小时前

双R9700：Qwen3.6 27B的最佳公式？

一名用户正在研究使用 llama.cpp 在双 AMD Radeon R9700 设置上优化 Qwen3.6-27B 模型，比较 Vulkan 和 ROCm 后端之间的性能。

media r/LocalLLaMA · 5 小时前

Gemma 4 WebGPU 内核实现 255 tok/s

Xenova 发布了 Gemma 4 的 WebGPU 内核，实现了每秒 255 个 token 的性能。此优化使密集模型在 Web 浏览器中的运行速度超过 100 tok/s。

blog Simon Willison · 5 小时前

使用 DSPy 评估和改进 Datasette Agent 的 SQL 系统提示

Simon Willison 利用 Claude Code 和 Fable 5 模型，自动化了 Datasette Agent 系统提示的评估和优化过程，特别针对其只读 SQL 查询执行功能。该过程涉及安装最新的 Datasette alpha 版本和 DSPy，以识别代理在处理模式信息方面的弱点。

media r/LocalLLaMA · 6 小时前

英伟达AI先驱拒绝AGI，将OpenAI和Anthropic与AOL相提并论

英伟达的一位知名人物表示，他不相信通用人工智能（AGI），并认为行业的重点应转向为企业定制的开源模型。

media r/LocalLLaMA · 6 小时前

使用 RTX 3090 进行本地基准测试 - Qwen3.6 27b 与 Ornith

一名用户在使用 inspect-ai 框架的 RTX 3090 上比较了 Qwen3.6 27b、Gemma4 26B A4B QAT 和 Ornith1.0 35B MoE，以评估本地模型的性能。测试结果显示，在通用知识、接地能力和代码基准方面结果不一，Qwen3.6 通常在得分上领先，而 Ornith 在 DROP 等特定领域表现出优势。

media Hugging Face Forums · 7 小时前

认识论压力测试 — Claude Sonnet 5 经 MarCognity-AI 验证

本文描述了使用 MarCognity-AI 的怀疑者代理（Skeptical Agent）对 Claude Sonnet 5 进行验证，以揭示文本置信度与实际可验证性之间的差距，称为“认识论断裂”。

media Hugging Face Forums · 7 小时前

Aiywin 框架提出螺旋递归用于 AI 推理

独立开发者 Aiywin.ai 推出了一种认知框架，用螺旋递归循环取代标准线性处理，以处理异常和不完整数据。该系统通过数学方式扩展上下文参数，直到找到结构化解决方案，而不是停止或产生幻觉。

media Hugging Face Forums · 8 小时前

Solo与MoA在多个任务上的基准测试

本文展示了将单个模型与混合智能体（MoA）配置在六个任务上进行比较的基准测试结果：Bug、Tool、Arch、Clinical、DLQ以及总体平均值。评估工具链使用Hermes Agent v0.18，分数由ChatGPT 5.5和Claude opus 4.8根据正确性、完整性、深度、可操作性、清晰度和信任度的权重标准生成。

media r/LocalLLaMA · 8 小时前