知识共享首次推出 CC 信号,这是一个开放的 AI 生态系统框架
        非营利组织 Creative Commons 率先发起了许可运动,允许创作者在保留版权的同时分享他们的作品,现在正在为 AI 时代做准备。 周三,该组织宣布启动一个新项目 CC signals,该项目将允许数据集持有者详细说明其内容如何被机器重用或不可以重用,就像训练 AI 模型一样。

         这个想法是为了在互联网的开放性和对更多的需求之间创造平衡数据来推动 AI 的运行。

         正如 Creative Commons 在一篇博文中解释的那样,正在进行的持续数据提取可能会削弱互联网的开放性,并可能看到实体将他们的网站隔离开来或用付费墙保护他们,而不是共享对其数据的访问。 另一方面,

         CC 信号项目旨在提供一种法律和技术解决方案,该解决方案将提供一个数据集共享框架,旨在控制数据的人和使用它来训练 AI 的人之间使用。

         对此类工具的需求正在增加,因为公司正在努力更改其政策和服务条款,以限制对其数据的 AI 训练或解释他们将在多大程度上将用户数据用于与 AI 相关的目的。

         例如,X 最初做了一个 change,允许第三方在其公共数据上训练他们的模型,然后后来又撤销了那个。Reddit 正在使用其 robots.txt 文件来告诉自动网络爬虫是否可以访问其网站限制机器人抓取其数据以训练 AI。 Cloudflare 正在寻找一种解决方案,该解决方案可以向 AI 机器人收取抓取费用,以及用于混淆它们的工具。 开源开发人员还构建了工具来减慢和浪费 AI 爬虫的资源,这些爬虫不遵守其“禁止爬行”指令。

         相反,CC 信号项目提出了一个不同的解决方案:一组工具,提供一系列法律可执行性,并且对它们具有道德权重,类似于 CC如今涵盖数十亿个开放许可的在线创意作品的许可证。

         “CC 信号旨在维持 AI 时代的公地,”知识共享首席执行官 Anna Tumadóttir 在一份公告中说。 “正如 CC 许可证帮助构建开放网络一样,我们相信 CC 信号将有助于塑造一个基于互惠的开放 AI 生态系统。”

        :该项目现在才刚刚开始成型。 早期设计已在 CC 网站和 GitHub 页面上发布。 组织积极在其计划于 2025 年 11 月推出 Alpha 版(早期测试)之前寻求公众反馈。 它还将举办一系列员工大会,提供反馈和问题。