全部文章
lab Cohere Blog · 6 天前

Cohere 通过自定义 MCP 服务器与 North 和 Wiz 自动化事件响应

Cohere 使用其企业 AI 平台 Cohere North 开发了一个安全代理,并通过自定义模型上下文协议(MCP)服务器与云安全平台 Wiz 集成。该架构通过八个原子工具将 North 连接到 Wiz 的 GraphQL API,从而实现从单个提示词启动的自动化事件响应工作流。该系统通过评估攻击链并根据互联网暴露程度和权限级别对风险进行排序,在大约 20 秒内完成毒性组合爆炸半径分析。它还通过检索问题详情、创建 Linear 工单、更新 Wiz 状态以及起草结构化事件响应报告来自动化端到端调查。此外,每周定时自动化会在每周一早上自动生成安全态势简报,无需人工干预。此集成消除了之前每个发现需要 30 分钟到两小时的分类循环,使工程师能够专注于评估结果而非原始警报。

github llama.cpp · 7 天前

llama.cpp b9788 为双 GPU 配置添加 SYCL 张量并行支持

llama.cpp 的 b9788 版本在 SYCL 后端中通过 --split-mode tensor 标志引入了对张量并行的支持。该实现通过在 meta-backend 中添加 comm_init、comm_free 和 comm_allreduce_tensor 函数,实现了双 GPU 通信。对于两个设备,它使用环形 all-reduce 策略,对小张量采用 FP32 直接 memcpy,对较大的张量则采用 BF16 压缩。由于 OneCCL 存在每个进程只能使用单个设备的限制,代码避免了使用 OneCCL,而是使用持久化缓冲区来维持 SYCL 池的不变性。在双 Intel Arc Pro B70 GPU 上进行的性能测试显示,对于 Llama-3.3-70B 和 Qwen3-Coder-Next-80B-A3B 模型,与 layer 模式相比有显著的速度提升。此次更新包括适用于 macOS、Linux、Windows、Android 和 openEuler 的新二进制文件,覆盖 CPU、CUDA、ROCm、Vulkan 和 SYCL 目标平台。