可以识别出“非特定性”作为其基础要件  第1张

中国社会科学院大学法学院刘晓春在《法学论坛》2024年第3期上发表题为《生成式人工智能数据训练中的“非作品性使用”及其合法性证成》的文章中指出:

生成式人工智能作为新质生产力的代表,为内容生产提供了强大的技术工具的同时,也在深刻改变着内容生产的相关利益关系,推动内容生产模式的纵深变革。生成式人工智能数据训练中对作品的使用,一方面,呈现完全不同于著作权法视野下原有作品使用行为的特征、功能和效果,另一方面,对于数据训练行为的著作权法定性,也深入牵动着各方主体的利益分配变动格局。

生成式人工智能数据训练中对于作品的使用,属于通过计算机进行信息处理的范畴,与典型的人类使用存在明显的差异。相较于一般的计算机信息处理如广义的文本挖掘等行为,生成式人工智能所使用的大语言模型具有更加明显的“非特定性”特征,亦即对于作品的使用并非基于对其独立、特定表达的使用,作品并非作为训练数据的可区别的独立对象而使用。通过比较著作权法下典型的作品使用行为,可以识别出“非特定性”作为生成式人工智能数据训练过程构成“非作品性使用”的基础要件。

通过数据训练产生的生成式人工智能工具,其生成物对于作品的市场替代效应和激励削弱,不需要通过将著作权延伸到训练数据行为来弥补。整体上,生成式人工智能对于人类创作者的影响,并非体现在总体激励的削弱,而是在于激励结构上的调整。面向人工智能时代,著作权法提供的激励结构,目标应为促进人们积极面对、适应、拥抱人工智能工具革新及其带来的新型生产方式,快速融入新质生产力的创新和发展。

就排除对于特定数据训练行为的保护而言,“直接排除”方案和“先进后出”方案很可能不存在实质上的差别。但是,就规则的应用扩展性而言,第一种“直接排除”方案的体系扩展可能性更高,可以适用于其他“非作品性使用”的情形,而第二种“先进后出”方案则更多局限于数据训练行为问题的精准解决。从权利范围看,“直接排除”保护的方案总体上优于“先进后出”的合理使用方案。