PG电子(中国)-官方网站

谷歌拉响通用人工智能警报首次公开 AI 安全防御蓝图-PG电子智能系统
  • 销售咨询:

    133-6446-6667

  • 服务咨询:

    0431-84857999

  

行业新闻

致力于弱电行业中高端产品与先进应用的倡导者

首页 > 新闻中心 > 行业新闻

谷歌拉响通用人工智能警报首次公开 AI 安全防御蓝图

2025-04-05 22:47:34 | 王华清 | 点击数:

  IT之家 4 月 4 日消息,科技媒体 WinBuzzer 昨日(4 月 3 日)发布博文,报道称谷歌旗下 DeepMind 最新发布全球 AGI(通用人工智能)安全框架,呼吁在技术失控前建立跨国防护机制。

  DeepMind 认为 AGI 即将落地,主张立即行动。AGI可能将在未来数年实现人类级认知能力,其自主决策特性可能加速医疗、教育等领域的突破,但滥用、目标错位等风险亦需警惕。

  谷歌 DeepMind 发布《技术性 AGI 安全与保障方法》白皮书,提出应对通用人工智能(AGI)潜在风险的系统性方案。

  IT之家援引博文介绍,报告聚焦四大风险领域(滥用、错位、事故、结构性风险),提出通过安全机制设计、透明化研究及行业协作降低危害。

谷歌拉响通用人工智能警报首次公开 AI 安全防御蓝图(图1)

  而目标错位是 AGI 核心风险之一。当 AI 为完成任务采取非常规手段(如入侵订票系统获取座位),即产生与人类意图的偏差。DeepMind 通过“放大监督”技术训练 AI 识别正确目标,并利用 AI 自评(如辩论机制)提升复杂场景下的判断力。

  DeepMind 提出的国际安全框架摒弃抽象伦理讨论,聚焦技术快速演进中的实际问题,包括组建类似核不扩散条约的跨国评估机构、设立国家级 AI 风险监测中心等。

  谷歌 DeepMind 提出强化技术研究、部署预警系统、通过国际机构协调治理三大支柱方案,强调当前亟需限制 AI 网络攻击等危险能力。

谷歌拉响通用人工智能警报首次公开 AI 安全防御蓝图(图2)

  DeepMind 的倡议并非孤立行动。竞争对手 Anthropic 于 2024 年 11 月警告需在 18 个月内遏制 AI 失控,并设置能力阈值触发保护机制;Meta 在 2025 年 2 月推出《前沿 AI 框架》,停止公开高危模型。

  安全防护已延伸至硬件领域。英伟达 2025 年 1 月推出 NeMo Guardrails 微服务套件,实时拦截有害输出,目前应用于医疗、汽车等行业。

  特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

  美股崩了,但斌表示遗憾,未能规避系统性风险!王一平:美国资产一毛钱不买

  史上最强贸易反制:中国凭什么敢第一个硬刚美国?一场硬仗,更是一场规则之战!对中国来说,长期看是好事!

  特朗普说永远不会改变政策 , 美股三大指数均收跌超5% , 美股2天暴跌47万亿元 , 纳指进入技术性熊市

  CPU-Z 八核处理器受欢迎度首超六核,AMD 锐龙7 9800X3D 最惹人爱

  Framework Laptop 12 模块化笔记本 4 月 9 日发售下载PG电子游戏的步骤是怎样的?安装复杂吗?下载PG电子游戏的步骤是怎样的?安装复杂吗?

696963202@qq.com
返回顶部